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ADN POLYMERASE THERMOSTABLE ET INTEINES DE L'ESPECE 
THERMOCOCCUS FUMICOLANS 

La presente invention concerne une nouvelle ADN 
5 polymerase thermostable ainsi que ses deux inteines, 
provenant d ■ une archaebacterie de 1 ' espece Thermococcus 
fumicolans . 

Les ADN polymerases sont des enzymes impliquees 
dans la replication et la reparation de l'ADN dans toute 

10 cellule vivante. On connait aujourd'hui de nombreuses ADN 
polymerases isolees de micro-organismes tel que E. coli 
(ADN polymerase I) ou du phage T4 . Des ADN polymerases 
ont aussi ete identifiees et purifiees et a partir de 
micro-organismes thermophiles comme Thermus aquaticus 

15 (Taq polymerase, Chien, A. et al . J. Bact. 1976, 

127:1550-1557 ; Kaladin et al. Biokhymiya 1980, 45:644- 
651), Thermus thermophilics, ou encore des especes du 
genre Bacillus (demande de brevet Europeen publiee sous 
le No. 699 760), Thermococcus (demande de brevet Europeen 

20 No. 455 430) , Sulfolobus et Pyrococcus (demande de brevet 
Europeen publiee sous le No. 547 3 59) . Parmi ces ADN 
polymerases issues d' archaebacteries on peut citer la 
Pfu, isolees de Pyrococcus furiosus (18), la Vent™ 

polymerase de Thermococcus litoralis (10), la 9°N de 
25 Pyrococcus sp. 9°N (15) et la DeepVent™ de Pyrococcus GB- 

D, les deux premieres provenant de souches du littoral 
(Baie de Naples) , les deux suivantes de souches sous- 
marines prof ondes . 

Le mecanisme d' action des ADN polymerases est 

30 aujourd'hui relativement bien connu et consiste en une 
replication de l'ADN a 1'identique selon un mode semi- 
conservatif. Le brin recopie sert de matrice et les 
quatre nucleotides triphosphates sont le substrat de 
cette polymerisation. Les enzymes ayant une activite ADN 

35 polymerase sont aujourd'hui de plus en plus utilisees in 
vitro afin de travailler en biologie mol^culaire dans 
divers buts tels le clonage, la detection d'erreurs, le 
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s6quencage, le marquage, et de fagon generale, 
1 'amplification de sequences d'acides nucl^iques. 

Cette amplification, in vitro, de sequences 
d'acide desoxyribonucleique fait appel a la technique de 
5 la reaction de polymerisation en chaine (PCR) decrite 
dans les brevets Europeens No. 200 362 et 201 184. Le 
principe de cette technique est base sur la realisation 
de cycles successifs d* extension d' amorces mettant en 
oeuvre les quatre nucleotides triphosphates ainsi qu'une 

10 ADN polymerase et un ADN matrice a recopier. A chaque 
cycle, 1 ' enzyme double le nombre de brins d'ADN 
disponibles et entre chaque cycle une thermodenaturation 
est necessaire afin d'ouvrir la double helice d'ADN pour 
le cycle suivant. Les temperatures utilisees pour cette 

15 etape de thermodenaturation ne sont pas compatibles avec 
la conservation de I'activite de la plupart des ADN 
polymerases connues, telle la Klenow. C'est ainsi que des 
nombreux efforts de recherche ont ete realises afin de 
trouver des enzymes supportant ces temperatures. 

20 Cependant, si les micro-organismes thermophiles 

sont aujourd'hui connus, il reste encore difficile 
d'obtenir ces enzymes thermos tables avec des rendements 
de production suffisants. La biologie mol^culaire et le 
genie genetique permettent de palier cet inconvenient. 

25 Ainsi, une fois repere dans le genome, le gene codant 
pour 1 1 ADN polymerase est clone, sequence puis redone 
dans un vecteur d' expression afin de produire la proteine 
dite alors recombinante , chez un hote mesophile plus aise 
a cultiver tel E. coli ou S. cerevisiae. Cette methode 

30 d' expression chez K. coli a notamment ete decrite dans la 
demande de brevet internationale PCT publiee sous le No. 
W0 89/06691 pour produire 1 1 ADN polymerase de Thermus 
aquaticus . 

L'ADN polymerase de 1 ' invention provient d'une 
35 archaebacterie de l'espece TherTnococcus fumicolans. Outre 
ses proprietes thermostables la rendant particulierement 
efficace notamment dans une processus de PCR, cette ADN 
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polymerase est remarquable en ce qu'elle presente deux 
"introns proteiques", encore appeles "inteines" , au 
niveau de son polypeptide precurseur. 

La sequence nucleotidique de ses int^ines est 
5 inseree dans celle de l'ADN polymerase, generalement au 
niveau de sites conserves impliques, apres traduction, 
dans les reactions catalytiques . Ces sequences sont 
transcrites et traduites en meme temps que celle de l'ADN 
polymerase et l'epissage autocatalytique des inteines 
10 produit alors trois enzymes: deux inteines et une ADN 
polymerase . 

On trouve de telles inteines egalement au sein 
d'autres molecules telles l'ATPase vacuolaire chez 5. 
cerevisiae (4), GyrA chez Mycobacterium leprae (7), Rec A 

15 chez Mycobacterium tuberculosis (5, 6). Les inteines font 
partie pour leur majorite de la famille des endonucleases 
de type "homing endonucleases" puisqu'elles coupent l'ADN 
en un site reconnu, a l'endroit meme oil leur sequence 
nucleotidique vient s ' inserer . 

20 Le developpement des biotechnologies tant dans 

la recherche que dans les domaines de la medecine ou de 
1 ' agro-alimentaire, necessite de disposer de divers types 
d 1 ADN polymerases susceptibles d'am^liorer 
quant itativement et qualitativement des techniques aussi 

25 diverses que le clonage, la detection, 1 1 amplif icatibn de 
sequences d' ADN. La presente invention vise precisement a 
offrir une nouvelle ADN polymerase thermos table qui est 
issue d'une espece r^cemment decrite: Thermococcus 
fumicolans (8) . Cet isolat a et<§ isol6 a partir de 

30 fragments de cheminees prelevees dans le bassin Nord- 
Fidgien lors de la campagne f ranco- japonnaise STARMER en 
1989. Cette espece, anaerobie stricte, presente une 
temperature optimale de croissance de 90°C, ce qui est 
relativement eleve pour un Thermococcus. Son pH optimum 

35 est de 8,8, et son taux de salinite de 20 g/1 a 40 g/1. 

L 1 invention a done pour objet une ADN 
polymerase purifiee thermostable d' archaebacteries de 
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l'espece Thermococcus fumicolans ayant un poids 
moleculaire de 1'ordre de 89000 Da ainsi que ses int6ines 
thermos tables, dont le gene comportant les deux sequences 
codant pour lesdites inteines a ete clone. 
5 Les travaux de recherche ayant permis 

d' identifier , de sequencer et d'6tudier l'ADN polymerase 
de 1* invention ont ete realisee a partir de la souche 
Thermococcus fumicolans ST557 deposee a la Collection de 
1'Institut Pasteur (CIP) sous le numero CIP 104680. Cette 
10 ADN polymerase sera denommee dans ce qui suit Tfu. Sa 
sequence de 774 acides amines est representee dans la 
liste de sequences en annexe sous le numero SEQ ID NO: 2. 
Un poids moleculaire de 89797 Da et un pi de 8.1 ont ete 
deduits de cette sequence. 

15 

L' invention concerne done l'ADN polymerase 
purifiee thermostable d ' archaebacteries de 1 ' espece 
Thermococcus fumicolans ayant un poids moleculaire de 
1'ordre de 89 000 daltons ainsi que ses derives 

20 enzymatiquement equivalents. On entend par derives 
enzymatiquement equivalent, les polypeptides et proteines 
constitues par ou comprenant la sequence en acides amines 
representee dans la liste de sequences en annexe sous le 
numero SEQ ID NO: 2 des lors qu'ils presentent les 

25 proprietes de 1 ' ADN polymerase de Thermococcus 
fumicolans. A ce titre 1* invention envisage plus 
particulierement une ADN polymerase dont la sequence en 
acides amines est representee dans la liste de sequence 
en annexe sous le numero SEQ ID NO:l ou un fragment de 

30 celle-ci ou encore un assemblage de tels fragments, comme 
la sequence de 774 acides amines representee dans la 
liste de sequences en annexe sous le numero SEQ ID NO: 2. 

En effet, la presence de deux inteines I-Tfu-1 
et I-Tfu-2 dans la sequence numero SEQ ID NO:l, sont 

35 susceptibles de conduire lors de la preparation par 
synthese chimique ou par genie genet ique, a des sequences 
d * ADN polymerase de T. fumiculans tronquees dont les 
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proprieties enzymatiques sont equivalente a celle de l'ADN 
polymerase de T. fumicolans purifite. 

On entend aussi par derives, les sequences en 
acides amines ci-dessus modifiees par insertion et/ou 
deletion et/ou substitution d'un ou plusieurs 
aminoacides, pour autant que les proprietes de l'ADN 
polymerase de T. fumicolans qui en resultent ne soient 
pas signif icativement modifiees. 

L * invention concerne egalement une sequence 
d'ADN constitute par ou comprenant la sequence codant 
pour une ADN polymerase de 1' invent ion. 

La sequence d'ADN represents dans la liste de 
sequences en annexe sous le numero SED ID NO: 1 
represente une telle sequence. L'ADN codant pour l'ADN 
polymerase de T. fumicolans et ses deux inteines est 
constitute par le nucleotides 357 a 5028. Les nucleotides 
1 a 356 correspondent a la region promotrice de ce gene. 
En consequence, 1 ' invention a pour objet une sequence 
d'ADN constitute par ou comprenant la sequence comprise 
entre les nucleotides 357 a 5028 de la SED ID NO: 1, ou 
un fragment de celle-ci ou encore un assemblage de tels 
fragments . 

1' invention se rapporte tout particulierement a 
une sequence d'ADN constitute par ou comprenant les 
nucltotides 357 a 1674 et 2755 a 3156 et 4324 a 5028 de 
la stquence d'ADN reprtsentt dans la liste de sequences 
en annexe sous le numtro SED ID NO: 1. 

Cette sequence code pour l'ADN polymerase de T. 
fumicolans dont la stquence de 774 acides amines est 
representte dans la liste de stquences en annexe sous le 
numtro SED ID NO: 2. 

L' invention concerne autant l'ADN polymtrase 
isoltes et purif ites de la souche Thermococcus fumicolans 
que l'ADN polymerase prtpartes par syn these chimique, par 
exemple par ligature de fragments polypeptidiques , ou 
encore par les methodes du gtnie genetique. 
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Dans le cadre de ces methodes du genie 
genetique, 1* invention a aussi pour objet un vecteur 
comprenant une sequence d'ADN definie precedemment , ainsi 
qu'un procede de production ou d' expression dans un hdte 
5 cellulaire des ADN thermostables de 1' invention. 

Un procede de production d'une ADN polymerase 
conforme a 1' invention consiste: 

- a transferer une sequence d'acide nucleique 
codant pour 1 ■ ADN polymerase ou un vecteur contenant 

10 ladite sequence dans un hote cellulaire, 

- a cultiver l'h6te cellulaire obtenu a l'etape 
precedente dans des conditions permettant la production 
de 1 'ADN polymerase, 

- a isoler, par tous moyens appropries, ladite 
15 ADN polymerase. 

L'hote cellulaire mis en oeuvre dans les 
procedes precedents peut etre choisi parmi les 
procaryotes ou les eucaryotes et notamment parmi les 
bacteries, les levures, les cellules de mammiferes, de 

20 plantes ou d'insectes. 

Le vecteur utilise est choisi en fonction de 
l'hote dans lequel il sera transfere. 

L ' ADN polymerase thermostable de 1 ' invention 
est utile notamment dans les procedes d' amplification 

25 enzymatique de sequences d'acides nucleiques. En 
consequence, 1' invention a pour objet, de tels procedes 
mettant en oeuvre 1 'ADN polymerase thermostable decrite 
precedemment , ainsi que les kits d 1 amplification 
comprenant, outre les reactifs generalement utilises, une 

30 quantite adequate de cette ADN polymerase. 

L 1 invention a egalement pour objet une inteine 
purifiee thermostable d 1 archaebacteries de l'espece 
Thermococcus fumicolans, 
35 Comme indique precedemment, les inteines sont 

aussi definies comme des introns proteiques qui sont non 
pas episses au niveau de l'ARN messager mais au niveau 
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d'une maturation proteique. Elles relevent done d'un seul 
gdne traduit et transcrit en une seule etape, et 
constituent des sous produits de la maturation de la 
proteine codee par ce gene (Xu, M.G., Comb, D.G . , Paulus 
5 H., Noren C.J., Shao Y. , Perler, F.,1994, Protein 
splicing : an analysis of the branched intermediate and 
its resolution by succinimidine formation. EMBO J . 13, 
5517-5522.) 

Les inteines sont des endonucleases de 
10 restriction qui ont la propriete de couper l'ADN a 
l'endroit meme oil s'insere leur gene, et en consequence, 
elles peuvent etre considerees comme des sequences 
egoistes. 

Les inteines possedent dans leur sequence toute 
15 1 ' information necessaire a leur propre epissage 
puisqu' elles s'epissent dans E. coli . 

II est possible de distinguer quatre grandes 
etapes de maturation proteique : 

- Une premiere etape de formation d'un 
20 intermediaire lineaire qui possede une fonction ester. 

Cette reaction est dependante du pH et de 1 ' environnement 
local de cette liaison (nature des acides amines) . Ce 
principe est utilise dans les kits de clonage, 
d' expression ou de purification mettant en oeuvre des 
25 inteines, car un changement de 1 ' environnement provoque 
ou non un episssage. En effet, celui-ci serai t inhibe a 
pH 11 et active a pH 7,5. 

- Une deuxieme etape de transesterif ication 
qui permet de transformer 1 ' intermediaire precedent et de 

30 d^placer l'equilibre de la premiere etape. 

La troisieme etape consiste en une 
cyclisation de l'asparagine liberant l'int^ine. 

- La quatrieme etape est la stabilisation de la 
proteine mature et la formation d'une reelle liaison 

35 peptidique. 

II est done possible de construire des mutants 
thermosensibles permettant de bloquer 1' epissage 
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proteique aux temperatures d' expression (30°C) et de 
l'induire par chauffage. 

Cette possibility de controle de 1' epissage 
proteique par la temperature peut-etre utilisee dans des 
5 vecteurs de clonage avec une sequence codant pour 
l'inteine et des sites de clonage autour. Si la proteine 
a doner et a exprimer est toxique pour I'hote, on peut 
la doner en deux fragments autour de la sequence 
d'inteine. Ainsi, globalement, le gene a doner est 

10 complet mais il est interrompu par la sequence de 
l'inteine. Lors de 1 ' expression, l'inteine se retrouve 
dans la proteine exprimee, la rendant ainsi inactive. II 
est alors possible par chauffage, a la fin de 
1' induction, de liberer l'inteine par epissage 

15 autocatalytique et ainsi retrouver la proteine clonee 
active. 

Les inteines permettent ainsi de realiser des 
purifications et sont utilises dans des kits selon le 
principe decrit ci-apres. Certains residus autour de site 

20 d' Epissage de l'inteine sont modifies. L' expression de la 
proteine recombinante est realisee a basse temperature 
pour bloquer un eventuel epissage trop precoce. En C- 
terminal de l'inteine est fixe un site ayant une forte 
af finite pour la chitine. Lors de 1' induction, la 

25 proteine clonee est exprimee ainsi que l'inteine et le 
site de fixation a la chitine. La purification est alors 
realisee avec la chitine, sur des colonnes d'af finite, 
qui retiennent la chitine et aussi l'inteine et la 
proteine clonee, le tout faisant partie de la meme pre- 

30 proteine. On hydrolyse alors l'extremite N-terminale de 
l'inteine avec du DTT ou du p-mercaptoethanol pour 
liberer la proteine clonee. 

Les inteines sont aussi des endonucleases de 
restrictions thermostables , qui ont pour site de 

35 reconnaissance l'endroit meme ou s'insere leur gene dans 
la sequence w hote" . Elles poss^dent une sequence 
nucleique repetee deux fois (LAGLIDADG) dans la proteine, 
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sequence plus ou moins conservee et qui correspond au 
site actif de reconnaissance et de coupure de 1'ADN. Ces 
enzymes semblent aussi avoir besoin de Mg++ pour leur 
activite. 

II convient de remarquer que les deux inteines 
de 1' invention sont coexprimees dans E. coli et sont 
autoepissees. Ce qui signifie qu'elle n'ont pas de 
toxicite pour l'hote, a la difference de l'une des 
inteines de Thexmococcus litoralis (9), et en consequence 
leur utilisation dans des kits d' expression ou de 
purification est aisee. 

Une premiere sequence d* inteine selon 
1' invention est representee dans la liste de sequences en 
annexe sous le numero SEQ ID NO: 3. Cette inteine, 
denommee I-Tfu-1, presente un poids moleculaire de 41 409 
Da et un pi de 9,13, deduits de la sequence de 360 acides 
airlines de la sequence SEQ ID NO: 3. 

Une seconde sequence d 1 inteine selon 
1' invention est representee dans la liste de sequences en 
annexe sous le numero SEQ ID NO : 4 . Cette inteine, 
denommee I-Tfu-2, presente un poids moleculaire de 44 765 
Da et pi de 9,6, deduits de la sequence de 389 acides 
amines de la sequence SEQ ID NO: 4. 

Comme rappele precedemment , les inteines 
thermostables de 1 • invention sont utiles notaroment dans 
les procedes de restriction d' acides nucleiques et dans 
la mise au point de vecteurs d' expression permettant de 
reduire la toxicite de la proteine a exprimer en inserant 
l'une des deux, sequences d' inteines dans la sequence de 
la proteine a exprimer. Ceci peut se faire sans 
manipulation de la sequence des inteines si le clonage 
s'effectue chez E. coii, les techniques d' expression 
utilisees ayant demontre leur inocuit6 pour cet organisme 
hote. En consequence, 1 ' invention a pour objet, de tels 
procedes mettant en oeuvre l'une des deux ou les deux 
inteines thermostables decrites precedemment, ainsi que 
les kits d' expression ou de purification contenant l'une 
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ou les deux sequences codant pour les dites inteines 
thermos tables. 

L' invention concerne egalement une sequence 
5 d'ADN constitute par ou comprenant la sequence codant 
pour une inteine de 1' invention. 

Une sequence d'ADN codant pour 1' inteine I-Tfu- 

1 est comprise entre les nucleotides 1675 et 2754 dans la 
sequence SED ID NO: 1 en annexe. Cette sequence d'ADN 

10 code pour 1' inteine dont la sequence en acides amines est 
representee dans la liste de sequences en annexe sous le 
numero SED ID NO: 3. 

Une sequence d'ADN codant pour 1' inteine I-Tfu- 

2 est comprise entre les nucleotides 3157 et 4323 dans la 
15 sequence SED ID NO: 1 en annexe. Cette sequence d'ADN 

code pour 1' inteine dont la sequence en acides amines est 
representee dans la liste de sequence en annexe sous le 
numero SED ID NO: 4. 

L' invention concerne autant ces inteines 
20 thermostables isolees et purifiees de la souche 
Thermococcus fumicolans que des inteines preparees par 
synthese chimique, par exemple par ligature de fragments 
polypeptidiques, ou encore par les methodes du genie 
genetique. 

25 Dans le cadre de ces methodes du genie 

genetique, 1 ' invention a aussi pour objet un vecteur 
comprenant une sequence d'ADN definie precedemment , ainsi 
qu'un precede de production ou d' expression dans un h6te 
cellulaire des ADN codant pour les inteines de 

30 1* invention. De tels procedes sont identiques a ceux 
rapportes precedemment pour l'ADN polymerase de T . 
fumicolans. 

D'autres avantages et caracteris tiques de 
35 1' invention apparaitront a la lecture des exemples qui 
suivent, donnes a titre non limitatifs et concernant le 
clonage, 1 • expression, la caracterisation et I'activite 
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de l'ADN thermostable de 1* invention, et se referant aux 
dessins annexes dans lesquels : 

- La figure 1 represente 1 ■ hybridation ADN-ADN 
de l'ADN g^nomique de T. fumicolans digere par di verses 
enzymes de restriction et hybride avec les sondes 
GE23ClaI-HindIII et GE23XhoI-SalI . 

- La figure 2 represente la strategie de 
clonage, la structure du gene de l'ADN polymerase de T. 
fumiculans et les produits du gene. 

- La figure 3 represente les resultats de 
purification de la polymerase recombinante de T. 
fumicolans apres une colonne d'heparine sepharose, 
visualises par SDS-PAGE. 

- La figure 4 represente les resultats de 
purification de la polymerase recombinante de T. 
fumiculans apres une colonne Bleue HTrap n°2, visualise 
par SDS-PAGE. 

- La figure 5 represente les resultats de 
purification de la polymerase recombinante de T. 
fumicolans apres une colonne de phosphocellulose , 
visualises par SDS-PAGE. 

- La figure 6 represente les resultats de 
purification de la polymerase recombinante de T. 
fumicolans apres une colonne MonoQ, visualises par SDS- 
PAGE. 

- La figure 7 represente les resultats de PCR 
avec l'ADN polymerase de T. fumicolans avec les fractions 
d' exclusion de la colonne MonoQ. 

I- Materiel et methodes. 

D Conditions de culture, olasmides et souches 

utilisees. 

Les souches Thermococcus litoralis (DSM 5474 T ) 
et Pyrococcus furiosus (DSM 3638 T ) ont ete obtenues 
aupres de la collection du Deutsche Sammlung von 
Microorganismen (DSM) Braunschweig-Stocheim, Allemagne . 
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La souche Pyrococcus sp. GE 23 a ete isolee de cheminees 
de sources hydrotherapies profondes et a ete fournie par 
G Erauso (CNRS, Station Biologique de Roscoff , France) . 
La souche Thermococcus fumicolans a ete obtenue aupres du 
5 laboratoire de Microbiologie Marine de G. Barbier 
(IFREMER-DRV-VP-CMM) a Brest, France. Cette souche, 
Thermococcus fumicolans a ete obtenue par purification a 
partir de fragments de cheminees hydrothermales 
receuillies dans le bassin nord-Fidgien lors de la 

10 campagne franco- japonaise STARMER effectuee en 1989 a 
2000 metres de profondeur. 

Pyrococcus sp.GE23 a ete cultivee a 85°C dans 
un milieu 2216S (DIFCO) a un pH de 6,5. 

Thermococcus fumicolans , decrite en 1996 

15 (Godfroy et al . ) est cultivee en conditions anaerobies 

dans un milieu contenant les elements suivants: peptone 
2g/l; extraits de levure 0,5g/l; sel de mer (Sigma) 
30g/l; tampon PIPES 6,05g/l, soufre elementaire 10g/l, 
rezasurine lmg/1. Le pH est ajuste a 8,5 par de la soude 

20 5N a 20°C. 

La souche de Escherichia coli SURE (Stratagene, 
La Jolla, Calif.) a ete cultivee dans du milieu LB avec 
le ou les antibiotiques appropries, a 37°C sous 
agitation. Cette souche a ete utilisee comme hote pour 

25 recevoir les constructions primaires a partir des 
vecteurs pUC 18 ou pBluescript. Les souches NovaBlue, 
BL2KDE3) et BL21(DE3)pLysS (Novagen, Madison, Wi.) ont 
ete cultivees dans du milieu 2xYT avec les antibiotiques 
appropries a 37°C ou 30°C. Ces souches ont ete utilisees 

30 commes hotes pour les plasmides d' expression. 

2) Isolement de l'ADN. hy bridation et ADN 
recombinants . 

L ' ADN de haut poids moleculaire de Thermococcus 
35 fumicolans a ete isole par la methode de Charbonnier 
modifiee (3) . Les cellules ont ete resuspendues dans un 
tampon TE-Na IX, puis lys6es a 40°C pendant trois heures 
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avec un melange de N-Lauryl-sarcosine 1%, dodecyl sulfate 
de sodium 1% et 0,4 mg/ml de proteinase K. Apres la lyse, 
une centrifugation a 5000g pendant 10 minutes permet 
d'eliminer les debris cellulaires. L 1 ADN est extrait par 
5 un traitement au Phenol-Chlorof orme-alcool Isoamylique ou 
PCI (25-24-1), puis traite par la RNAse a 5jig/ml a 60°C 
pendant une heure. Ces etapes sont suivies de deux 
extractions additionelles par PCI et d'une extraction au 
chlorophorme . L'ADN est ensuite precipite a 1'ethanol 

10 absolu a -20°C, puis centrifuge, seche a l'air et repris 
dans un tampon TE-lx. La concentration et la purete de 
cet ADN sont mesurees par spectrophotometrie a 230, 260 
et 280nm avec un appareil GeneQuantll (Pharmacia, 
Upsalla, Sweden) . Pour la construction de la mini-banque 

15 genomique en pUC 18 (17), I'ADN a ete totalement digere 
pendant une nuit a 37°C par une serie d* enzymes de 
restriction (BamHI, Hindlll, EcoRI, EcoRV, PvuII, Sail, 
Xbal et Xhol) par simples et doubles digestions. Puis les 
fragments d* ADN sont fractionnes sur gel d' agarose a 0,8% 

20 dans de TBE-1X et trans feres sous vide sur une membrane 
de nylon Hybond-N+ (Amersham, UK) . Ces membranes ont et£ 
hybridees avec des sondes d 1 ADN preparees par PCR avec 
des amorces specifiques selectionnees a partir des genes 
d 1 ADN polymerases de P. furiosus , T. litoralis et 

25 Pyrococcus sp. GE23 . Ces sondes sont prealablement 
marquees au P par tt random priming" conformement aux 
recornmandations du fabricant (Megaprime, Amersham, UK) . 
Deux sondes de P. furiosus ont ete utilisees, Pfu et Pfu 
F, couvrant respect ivement les regions delimitees par les 

30 paires de bases 8 a 2316 et 819 a 1915 de la section 
codante du gene de la polymerase comme defini par Uemori 
et al. (18) . Deux sondes de T. litoralis, Tli I et Tli T, 
couvrant respectivement les regions delimitees par les 
paires de bases 297 a 1768 et 4631 a 5378, 

35 comme defini par Hodges et al . (9). Deux sondes de 
Pyrococcus sp GE23 ont ete utilisees, l'une contenant la 
partie 5' du g6ne (fragment Clal-Hindlll 
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correspondant aux sites pb 8 et pb 13 53 de la section 
codante) et 1 ' autre contenant la partie terminale de ce 
meme gene obtenu par PCR (amorces dites d' expression Ndel 
et Sail correspondant aux sites pb -1 et pb 2318, puis 
5 digestion par Xhol et Sail comprenant les bases du n° 
1879 a 2318) . Les fragments positifs ont ete identifies 
par hybridation ADN-ADN (14) . Seules les hybridations 
avec les sondes de Pyrococcus sp. GE 23 ont fourni des 
signaux positifs a 55°C en moins de 24 h d' exposition. 

10 Les sondes issues de T. litoralis et de P. furiosus n'ont 
donne aucun resultat, m§me a 50°C dans un tampon standard 
sans formamide. A partir des hybridations avec les sondes 
de Pyrococcus sp. GE 23, des fragments Hindlll de 1,9 kb 
ont ete selectionnes , puis prepares par une digestion 

15 appropriee de lOOpg d 1 ADN genomique, purifies dans des 
sacs de dialyse a partir des gels d' agarose, et 
precipites a l'ethanol absolu apres une extraction au 
PCI. Les fragments ont ete ligatures dans un pUC 
18/HindIII dephosphoryle. Les transformations des souches 

20 hotes ont ete realisees par electroporation (Gene Pulser, 
Biorad) . Le criblage des clones recombinants a 6te 
effectue par selection a 1 ' ampicilline , alpha- 
complementation sur substrat X-Gal-IPTG puis hybridation 
de colonies selon les techniques standards (12) . La 

25 temperature des hybridations de colonies etait de 55°C 
avec les sondes de Pyrococcus sp GE23, dans un tampon 
standard sans formamide. L* ADN plasmidique a ete isole 
selon la m^thode decrite par Birnboim et Doly (1) , puis 
purifie par chromatographie echangeuse d* anions en phase 

30 solide (Quiagen, Chatsworth, Calif.). Les fragments de 
restriction des plasmides ont et6 purifies sur gel 
d 1 agarose par la methode du GeneClean (Bio 101, La Jolla, 
Calif.) pour un clonage ulterieur. 

L ■ ARNr 16S et 23S de Thermococcus fumicolans a 

35 ete amplifie par PCR en utilisant les amorces suivantes : 

- amorce directe Aa: 5' TCCGGTTGATCCTGCCGGAA-3 ' 

- amorce reverse 23Sa: 5 1 -CTTTCGGTCGCCCCTACT-3 ' 
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- etape initiale 3 minutes a 94°C suivi de 30 
cycles (94°C, lmin/ 49°C, Imn/ 72°C, 2mn) et, elongation 
finale de 5 mn a 72°C. 

Le produit de PCR a ete clone dans le vecteur 
pUC18 pour sequengage ulterieur. 

3) Seouencaae des ADN. 

Les sequences d'ADN ont ete obtenues par la 
methode de terminaison de chaine (13) en utilisant un 
systeme d'analyses automatique d'ADN Applied Biosystems. 
Les deux brins des genes codant pour l'ADN polymerase et 
les deux inteines ont ete sequences en utilisant des 
amorces universelles localisees sur des vecteurs ainsi 
que des amorces internes . 

La sequence d'ADNr 16S a ete realisee sur les 
deux brins, apres clonage (SureClone, Pharmacia, Uppsala, 
Sweeden), en utilisant le kit Hot-Tub (Amersham, UK.) 
afin de lever les compressions . 

L' analyse de sequence a ete realisee avec le 
logiciel DNASTAR (Madison, Wis., USA) et le programme de 
Genetic Computer Group (University of Wisconsin 
Biotechnology Center, Wis., USA) accessible en ligne sur 
INFOBIOGEN. Les recherches inf ormatisees de similitude 
ont ete realisees avec le programme BLAST, les 
alignements multiples avec CLUSTAL V, et les arbres 
phylogenetiques ont ete etablis selon la methode dite de 
" Neighbour- j oining M ( 11 ) . 

4) Construction du recombinant exorimant 1 'ADM 
polymerase de Thermococcus fumicolans . 

L'ADN polymerase de Thermococcus fumicolans 
ainsi que ses deux inteines, ont ete exprimees en meme 
temps chez E. coli avec le vecteur d' expression PARHS2 
qui appartient a la famille des systemes d' expression T7 
(16) acquis aupres d ' Eurogentec . 

La PCR a ete utilisee pour preparer le fragment 
complet de l'ADN polymerase et des deux inteines en 
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utilisant des amorces contenant les sites de restriction 
Ndel et BamHI : 

- amorce Tfu Dir : 
5'-TGG GGA TCC ATA TGA TCC TCG ATA CAG ACT ACA TC-3 1 
5 - amorce Tfu Rev : 

5 ' -AAG CTT GGA TCC TCA TTT CTT CCC CAT TTT GAG CC-3 1 

Le melange reactionnel contenait l'ADN 
polymerase GOLDSTAR (Eurogentec, B) , 1 ' enzyme Tag 
Extender (contenant la Pfu de Stratagene) , le tampon 

10 d' extension avec les quatre dNTP (chacun a 0,2mM) et les 
amorces Tfu Dir et Tfu Rev a 50 pmoles dans un volume de 
50\xl final. L' amplification a ete effectuee sur 20 cycles 
: 1 mn 94°C, 1 mn a 54°C et 6 mn a 72°C en utilisant un 
thermocycleur Stratagene 96-gradient. Les fragments de 

15 PCR ont ensuite ete digeres par les enzymes Ndel et BamHI 
puis ligatures aux memes sites du vecteur, retablissant 
ainsi le codon d ' initiation . La construction ainsi 
obtenue a ete nommee PARHS2TFU1. Cette construction a ete 
sequencee aux sites de jonction afin de verifier son 

20 integrite par rapport a la sequence de l'ADN genomique. 
Les tests d' expression ont ete realises selon le 
protocole suivant: selection des clones recombinants dans 
la souche E. coli Novablue, expression avec la souche 
BL21(DE3)pLysS dans un milieu 2xYT et induction de quatre 

25 heures a ImM d'IPTG. 

Les premiers essais d' induction ont et6 
realises sur des cultures de 5 ml, induites ou non. Des 
precultures de nuit sont realisees sans inducteur et 
relancees dans un milieu frais le matin (au dizieme) , 

30 jusqu'a ce que la densite optique (mesuree a 600nm) soit 
de 0,6, puis soit induites pendant 4 heures, soit non 
induites et arr£tees au bout de 2, 4 ou 14 heures. Quatre 
ml de cultures sont alors centrifuges a 4°C, SOOOrpm 
pendant 10 minutes. Le culot est ensuite repris dans un 

35 tampon de lyse (Tris-HCl lOmM pH 7,5; NaCl lOmM, MgCl2 2 
mM) . Les cellules ainsi reprises sont alors lysees, soit 
avec du triton X-100 1% v/v, soit du lysozyme a lmg/ml de 
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lyse et laiss^es sur glace environ 5 a 10 min. Les 
cellules sont ensuite thermodenaturees par une exposition 
de 20 min a 72 °C. Ceci permet de detruire en grande 
partie les cellules de l'hote mesophile sans detruire les 
5 proteines recombinantes . Le produit de lyse est ensuite 
centrifuge 20 min a 10 OOOrpm a 4°C. Le surnageant est 
recupere afin de le tester en incorporation, en PCR ou 
sur gel. Les incorporations sont realisees suivant deux 
techniques : 

10 - Avec de la thymidine tritiee comrae traceur. 

L' incorporation est realisee sur du thymus de veau active 
(SIGMA Aldrich, F) dans le milieu de reaction suivant: 
Tris-HCl 50mM pH 8,8 ; DTT ImM ; MgCl2 10mM ; KC1 lOraM ; 

BSA 0,4 mg/ml; chaque dNTP a 0,4 mM. 

32 

15 - Avec du P -dATP (Amersham) comme traceur. 

L' incorporation est realisee sur de 1'ADN thymus de veau 
active (Appligene) dans le milieu de reaction suivant: 
Tris-HCl pH 9 50mM; KC1 50mM; MgCl2 7mM; BSA 0,2mg/ml et 
(NH4+)S04 (filtre) 16mM, avec un melange des 4 dNTP a 

20 5 0 0uM final chacun. Cette seconde m^thode permet 
d'estimer avec precision le nombre d'unites d' enzyme. 

5) Purification . 

25 a) Culture. 

Apres des essais en petits volumes, les 
cultures destinees a 1' expression de 1 ' enzyme 
recombinante ont ete realisees comme suit: production 
d'un inoculum de 7 00 ml (milieu 2x YT complements en 

30 ampicilline et chloramphenicol) cultive a 30°C jusqu'a 
DO = 0,8; ensemencement d'un fermenteur contenant 16 1 du 
meme milieu; culture pendant 4 h jusqu'a DO= 0,6, puis 
induction a l'IPTG 1 mM et culture pendant 4 h. La 
biomasse resultante est centrifugee 20 ran a 6 000 rpm a 

35 4°C (Centrifugeuse JOUAN) . 
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b > Lyse ceUul^ye s£ premiere etaoe dg 

purification. 

20 g de biomasse sont repris dans 80 ml de 
tampon (20 mM Tris-Cl pH 7,5; 10 mM NaCl; 2 mM MgC12; 1 
5 mM EGTA ; 1% Triton xlOO; 2,2 mM PMSF) . Le melange 
resultant, maintenu a 4°C maximum, est sonique a 12 
reprises successives (cycle de 15 s) jusqu'a obtention 
d'une solution liquide. Le surnageant est ensuite 
centrifuge 20 mn a 4°C a 20 000 rpm ( SORVALL Ti45) . Le 
10 surnageant est recupere et traite par la chaleur (70°C 
pendant 10 mn) afin de thermodenaturer l'essentiel des 
proteines natives de E. coli, puis centrifuge a nouveau. 

c) Chromatoaraphie , 

15 Les 70 ml de surnageant issus de 1'etape 

precedente sont charges sur une colonne Pharmacia 
Heparine Sepharose (30 ml de resine) , apres equilibration 
avec un tampon A (10 mM Tris-Cl pH 7,5; 0,5 mM EGTA; 5 mM 
MgCl2; 10 mM P-mercaptoethanol; 0,2% Triton xlOO et 10% 

20 glycerol. Un lavage est effectue avec un tampon B (idem 
tampon A + 2 M NaCl) a raison de 0,3 ml/mn sur un systeme 
FPLC Pharmacia. Les differentes fractions sont recuperees 
en gradient de NaCl. 

Les fractions actives ainsi recuperees sont 

25 dialysees pendant 5 h contre un tampon C: 10 mM Tris-Cl 
pH 7,5; 0,5 mM EGTA; 5 mM MgCl2; 10 mM -mercaptoethanol ; 
0,2% Triton xlOO; 10% glycerol; 50 mM NaCl. Les produits 
issus de dialyse sont successivement charges sur une 
colonne d'af finite pour les proteines se liant a l'ADN 

30 (Pharmacia, Bleue HiTrap) et elues en gradient de NaCl 
avec les memes tampons que prec^demment . 

30ml de fractions actives obtenues precedemment 
sont chargees sur une colonne de phosphocellulose avec de 
la resine Pll de Whatmann ( volume :20ml; diametre: 

35 2,5cm). Ces fractions ont ete dialysees 5 heures contre 
le tampon suivant : KP04 pH7 20mM, EDTA 0,lmM, DTT ImM, 
Glycerol 5%, Triton X-100 0,1% et KC1 0,1M. Le debit de 
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la colonne est regie a 0,2ml/min, le tampon A de 
chargement est compose de KP04 pH7 20mM, EDTA 0,lmM, DTT 
ImM, Glycerol 5%, Triton X-100 0,1% et le gradient (entre 
0% et 50% deB) est realise par le KC1 present dans tampon 
B a 2M. 

Ayant deja mis en evidence que cette polymerase 
ne se fixe pas sur une MonoQ ou une ressource Q et ce, 
quel que soit le pH utilise, nous avons essaye de la 
recuperer en exclusion en faisant 1' hypo these d'une 
fixation de l'ADN contaminant par la colonne. 

Tout d'abord un essai a ete realise en sortie 
de la deuxieme Bleue HiTrap avec un aliquot de 5ml et 
dialyse selon la meme methode que pour un passage sur une 
Bleue HiTrap. 

Une deuxieme tentative a ete realisee apres la 
phosphocellulose et apres deux dialyses des fractions les 
plus actives 45. 46 et 49. Les fractions sont tout 
d'abord chauffees 40 min a 85°C. Une premiere dialyse est 
alors realisee contre le tampon KC1 0,lmM, K 2 HP04 1M 
pH7,5 pendant 3 heures. La deuxieme dialyse est realisee 
avec le tampon suivant : K2HP04 pH 7,5 lOmM, K2P04 lOmM, 
KC1 25mM, DTT ImM, Triton X-100 0,1%, Glycerol 10%, 
pendant 1 heure. La solution est alors chargee sur une 
colonne MonoQ a 0,5ml /min avec un gradient en NaCl de 0 a 
20% (tampons utilises pour l'Heparine) . 

6) Activites exana£lgafiig US§ 

Les tests d' exonuclease 3 '-5' sont quantifies 
par la liberation de nucleotides marques au 32 p 

A cette fin, une premiere etape permet de 
realiser le marquage: l'ADN de est digere par Hindlll 
puis, le fragment de Klenow recopie l'ADN a partir des 
extrcpites 3' -OH libres , dans un milieu contenant outre 
le tampon, l'ADN et 1' enzyme, du 32 P dATP et du 32 p dTTP, 
les dGTPet dCTP etant froids. Apres une heure a 37°C, les 
quatre dNTP froids sont rajoutes en exces pour une demi- 
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heure. La Klenow et les dNTP sont elimines par une 
extraction au phenol et precipites a l'ethanol. 

Les tests exonucleasiques sont effectues dans 
des solutions contenant les tampons des enzymes, 
5 0,02mg/ml d'ADN marque, et incubees toute la nuit a 72°C, 
80°C et 95°C. Differents tampons contenant du MgCl2 ou du 
MnS04 sont testes. Le meme test est realise avec la Vent 
en temoin positif . 101 de solution de reaction sont alors 
deposes sur papier DE81 (Watmann) , s6ches puis comptes 

10 avant et apres lavage (3 fois 5 min avec du Na2HP04, 1 
fois a l'eau puis a l'ethanol a 95%) en utilisant la 
technique de Cerenkov. 

Pour le test d'actvite exonucleasique 5'-3', la 
reaction de marquage utilise la polynucleotide kinase 

15 afin de marquer le substrat en 5'. 

II - Resultats . 



1) Isolemen t du aene de 1 ' ADN polymerase de 
20 Thermococcus fumicolans ainsi que des deux genes 
d'jflteipes. 

L'ADN de Thermococcus fumicolans, digere par 
une serie d' enzymes de restriction, a ete hybride a des 
sondes de P. furiosus et T. litoralis, preparees par PCR 

25 et aux sondes de Pyrococcus sp. GE23 obtenues lors du 
clonage de cette autre ADN polymerase (Depot de brevet 
n°96 08631 aupres de l'INPI). Comme montre dans les 
figures la et lb, 1 'hybridation de type Southern blot a 
revele des fragments de deux types : un fragment Hindlll- 

30. Hindlll de 1,9 kb et un fragment Xhol-Xhol de 5 kb. Ces 

deux fragments ont ete reveles uniquement avec la sonde 

Clal-Hindlll du gene de Pyrococcus sp. GE23, marquee au 
32 

P avec une exposition de deux heures . Les deux 
fragments reperes ont ensuite ete recuperes et purifies 
35 comme decrit prec^demment dans Materiel et Methodes puis 
clones dans le vecteur pUC18 dephosphoryle et digere par 
Hindlll ou dans le vecteur pBluescript dephosphoryle et 
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digere par Xhol. Environ 400 recombinants ( E m Coli SURE) 
ont ete cribles avec la sonde Clal-Hindlll . Sur ces 400 
colonies, deux ont donne un signal positif lors de 
1' hybridation. (n° 9.26 et 12.79). Les deux clones ont 
ete mis en culture en milieu LB -Amp et leurs profils de 
restriction etaient identiques, avec un insert de 1,8 kb. 
Le sequengage ulterieur de l'un de ces clones (d£signe 
557MACa) et la comparaison de sequence (Megalign, 
programme DNASTAR) ont montre qu'il correspond a la 
region promotrice et aux 1404 premieres paires de base 
d'un gene d'une ADN polymerase appar tenant a la famille B 
(2) . 

En ce qui concerne le fragment Xhol-Xhol de 
5 kb, 700 recombinants ont ete cribles sans aucun signal 
positif lors de 1 'hybridation. Cette absence de reussite 
pourrait etre due a la presence d'une inteine au sein de 
ce fragment, le rendant alors instable dans un vecteur a 
haut nombre de copies de type pBluescript. 

Apres 12 heures d' exposition, un deuxieme 
fragment Hindlll-Hindlll de 2 kb a ete repere par 
hybridation de type Southern sur la meme membrane que 
.' precedemment, en utilisant comme sonde marquee la fin du 
gene de Pyrococcus sp. GE23 entre les sites Xhol et Sail 
(fragment obtenu par digestion de produit de PCR) . Ce 
fragment a ete clone comme precedemment. Environ 200 
clones recombinants ont ete cribles et quatre d' entre eux 
ont donne un signal positif. Les quatres clones ont un 
profil identique apres digestion par 1 ' enzyme de 
restriction Hindlll. L'un d'entre eux, 557MACc, a 6te 
sequence et la comparaison de sequence a demontre qu'il 
s'agissait de la fin du gene de l'ADN polymerase 
precedemment identifiee. 

Supposant que les fragments de genes obtenus 
appar tenaient a la meme ADN polymerase, des 
oligonucleotides ont £te utilises afin d' amplifier la 
zone manquante. Ce fragment de PCR a ensuite ete purifie 
sur gel comme decrit dans Materiel et Methodes, et 
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utilise comme sonde marquee radioactivement pour reperer 
sur la membrane le fragment manquant. Apres deux heures 
de revelation un fragment Hindlll-Hindlll a ete revele, 
de 2 kb environ. Clone comme precedemment, 600 colonies 
ont alors ete criblees, donnant quatre clones positifs. 
Les guatre clones avaient le meme profil et l'un d'entre 
eux, nomme 557MACb a ete sequence et les comparaisons de 
sequences ont demontre gu'il s'agit de la par tie 
intermediate de l'ADN polymerase et ce fragment, 
delimite par deux sites Hindlll, s'insere parfaitement 
entre 557MACa et 557MACc. L' ensemble de ces trois clones 
donne la sequence complete de l'ADN polymerase de T. 
fumicolans. 

2 > PQsition phyloqenetiaue d« Thermonnr.ru* 

fumicolans 

Thermococcus fumicolans est une nouvelle espece 
de Thermococcales decrite par Godfroy et al (8). 

3 ) Sequences nucle otidioues et polvpeotidinngc; 
de. l'ADN polymer ase de Thermocncrus fumicnl ans 

a) Sequenc es nucl«?otidiaues 

Les trois fragments delimites par des sites 
Hindlll ont ete assembles ( figures 2 et 3 ) . lis f orment a 
eux trois un fragment de 5039 paires de bases. Le premier 
fragment, issu du clone 557MACa, contient le codon de 
depart ATG en position 457 pb. La phase ouverte de 
lecture est alors ininterrompue sur 4572 paires de bases 
jusqu'a rencontrer un codon STOP sur le fragment issu du 
clone 557MACC en position 5028 pb, six paires de bases 
avant le dernier site Hindlll. Par alignement, avec les 
autres genes d'ADN polymerases disponibles en banques 
(Pfu, Tli, GB-D, KOD, ..), avec la methode CLUSTAL V, 
completee par un alignement manuel final necessaire pour 
restituer les sites d' autoepissage des inteines, deux 
sequences d' insertions ont ete mises en evidence. 
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- La premiere est inseree a la paire de base n° 
1675 et se termine a 2754, etant ainsi repartie entre le 
fragment issu du clone 557MACa et celui du clone 557MACb. 

- La deuxieme est inseree a la base n° 3157 et 
se termine a 4323. Elle est, de meme, repartie entre le 
clone 557MACb et 557MACC. 

Ces deux sequences d' insertions forment, avec 
le reste de la sequence codant pour l'ADN polymerase, un 
seul cadre de lecture. 

b) Sequence s polvpeptidiaues . 
La section codante du gene de l'ADN 

polymerase est done constitute de trois parties 
disjointes. La premiere partie du gene, portee par 
557MACa, comporte la zone codant pour 1 ' exonuclease 3'- 
5', ou apres traduction, on reconnait le motif FDIET. La 
deuxieme partie, portee par 557MACb et la troisieme 
partie portee par 557MACc comprennent les sites conserves 
SLYPSI, et YG.DTD. 

Les deux sequences d' insertion sont situees 
sur des zones conservees de l'ADN polymerase, la premiere 
au site DFR/SLYPSII come I-KOD-1 de Pyrococcus sp. K0D1 
et la deuxieme au site D/TDG comme I-Tli-1 de T . 
litoralis. Ces deux proteines sont liberees par 
autoepissage proteique. Elles comportent les sites de 
type LAGLIDADG repetes deux fois a 100 paires de bases de 
distance environ. Les alignements avec les autres 
inteines deposees dans les banques de sequences 
permettent de les assimiler a des endonucleases de 
restriction de type archaebacterien, endonucleases qui 
coupent l'ADN a l'endroit precis ou leur gene s'insere. 

c) Comparaispn avec les autres s^ n ences d'Anw 
polymerases . 

35 L'alignement des differentes sequences 

polypeptidiques des ADN polymerases de Thermococcales 
disponibles en banque, P. abyssi strain GE5 , Pyrococcus 
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sp. GE23, Pyrococcus sp. KODl, Pyrococcus sp. GB-D, P. 
furiosus, Pyrococcus sp 9°N, T. litoralis avec la 
sequence de T. fumicolans (sans inteines), realise avec 
le programme CLUSTAL utilisant la matrice PAM250, donne 
5 les niveaux de similarite entre ces diverses polymerases 
figurant au tableau 1 ci-dessous. 

Tableau 1 



Espece 


1 


2 


3 


4 


5 


6 


7 


8 


1 - T. fumicolans 


XXX 


81,7 


89,3 


77, 6 


77,3 


80,0 


79,3 


90,6 


2 - P. sp. GB-D 




XXX 


81,3 


85,1 


76,9 


89,0 


88,1 


82,6 


3 - P. sp. KODl 






XXX 


78,8 


77,5 


80,7 


79,9 


90,3 


4 - P. furiosus 








XXX 


73,9 


83,3 


82,5 


79,6 


5 - T. litoralis 










XXX 


75,9 


75,0 


76,5 


6 - P. sp. GE23 












XXX 


98,7 


80,9 


7 - P. abyss i 














XXX 


80,2 


8 - P. sp. 9°N 
















XXX 



Le niveau de similarite le plus proche est 



10 celui observe avec Pyrococcus sp. 9°N (90,6%), ce qui 
indique clairement que l'ADN polymerase de T. fumicolans 
est originale au niveau de sa sequence et constitue de ce 
fait une nouvelle ADN polymerase. 



15 d) Comparaison des inteines avec les autres 

inteines disponible s dans les bancrues . 

Les sequences disponibles en banque ont ete 
alignees selon les memes methodes que precedemment . Les 
comparaisons de 1' ensemble des inteines demontrent que 

20 celles-ci sont reparties en trois groupes correspondant 
aux sites d'insertion des motifs A (R/SLYPSI), B 
(KILAN/S) et C (D/TDG) . L'analyse des niveaux de 
similarite et la recherche de relations phylogenetiques 
n'ont de sens que pour des inteines appartenant a la meme 

25 classe, c'est a dire s'inserant dans un motif donne. Les 
niveaux de similarites pour I-Tfu-1 (classe A) et I-Tfu-2 
(classe C) avec leurs inteines homologues dej& decrites 
sont donnes respectivement aux tableaux 2 et 3 ci- 
dessous. 

30 Tableau ? 
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1 


2 


3 


1 


I-Tfu-1 


XXX 


41,4 


75,3 


2 


I-Mia-1 




XXX 


51,7 


3 


I-KOD-1 






XXX 



Tableau 3 







1 


2 


1 


I-Tfu-1 


XXX 


62,2 


2 


I-I-Tfli-2 




XXX 



I-Tfu-1 et l-Tfu-2 semblent representer deux 
nouveaux "alleles" des "homing" endonucleases 
archaebacteriennes des classes A et C. 

I-Tfu-1 est le troisieme allele connu d'inteine 
s'inserant au site A des ADN polymerase d'Archaea, tandis 
que I-Tfu-2 est le second de sa classe. 

5) Expression, caracferisation et act-^Ht-£ Ho 
1 'ADN polymerase de T. fumirnl^ 

a) Clonaoe et smrpssi^ 

Un insert de 4595 pb obtenu par PCR longue- 
distance avec les amorces TfuDir et TfuRev et couvrant la 
total ite du gene de 1 'ADN polymerase de Thermococcus 
fumicolans, avec les deux inteines, a ete clone aux sites 
Ndel et BamHI d'un vecteur pour transformer la souche E. 
coli Novablue. Des mini-preparations d'ADN plasmidique 
ont ete realisees sur une dizaine de clones transformants 
et ont toutes donne un signal positif a 1' hybridation. 
Deux clones ont ete retenus sur la base de leur profil 
apres une digestion par Ndel et Sail ou par Hindlll. Ces 
deux plasmides ont ensuite ete transformes dans la souche 
E. coli BL21(DE3)pLysS. 

Des essais d' expression ont ete realises en 
culture de 5 ml afin de determiner les conditions 
optimales de culture et d' induction. Tout d'abord les 
essais de cultures ont ete realises a 37°C, ou l'on 
observe une lyse cellulaire trop importance, puis a 30°C 
ou la culture ne lyse pratiquement pas. La culture est 
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realisee en milieu 2xYT. ou le renderaent de production 
est meilleur et la lyse reduite, supplemente avec de 
l'ampicilline (lOOug/ml) et du chloramphenicol (15ug/ml) . 
L ' expression est alors induite en phase exponentielle de 
croissance <DO600nm = 0,6 a 0,7) avec une concentration 
en IPTG de ImM, concentration qui s'est averee optimale. 
Des echantillons soht preleves avant induction puis 2 
heures, 4 heures et 6 heures apres induction, ainsi 
qu' apres une nuit. Des prelevemments sont aussi realises 
sur les cultures non induites apres 6, 8, 12 et 24 heures 
de culture. 

Les echantillons sont alors traites comme 
indique au chapitre Materiel et Methodes, afin de tester 
le niveau d' activite de l'ADN polymerase recombinante par 
incorporation de thymidine tritiee ou de 32 P dCTP. Cette 
premiere technique, qui permet une approche qualitative, 
nous donne deux types de comportement . Un des clones est 
non inductible et la meilleure activite est obtenue apres 
une nuit de culture (clone rTful-1) . Un second clone est 
inductible et presente une activite maximale apres quatre 
heures d' induction, activite qui diminue par la suite 
(clone rTfulOO-2). Deux autres clones, aussi testes sont 
faiblement inductibles et expriment tres peu l'ADN 
polymerase . 

Les clones rTful-1 et rTfulOO-2 sont ensuite 
testes en erlenmeyer de 50 ml dans les conditions 
decrites precedemment . Seul le clone inductible rTfulOO-2 
a une expression constante en volume de 50 ml. La suite 
des travaux a done ete realisee sur ce clone. 

b) Fermentation et extraction des rf>11nl» g 
La culture du clone TfulOO-2 a ete realisee 
dans un fermenteur de 16 litres, dans le milieu 2xYT 
supplemente en ampicilline et chloramphenicol. La 
preculture, de 750ml a ete realisee la veille et arretee 
en phase exponentielle (DO 600nm= 0,7-0,8) et laissee a 
4°C pour la nuit. Le fermenteur a ete prepare et mis en 
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temperature a 30°C avec le milieu de culture. La 
preculture a ete remise a 3 0°C une heure avant son 
transfert dans le fermenteur. Le volume final de culture 
est de 15 litres. Les conditions sont les suivantes : 
temperature = 30°C ; agitation = 300 rpm. L'induction 
avec 1 mM d'IPTG a ete realisee a DO 600 = 0,58. Le pH de 
la culture a ete regule a 7 pendant la phase 
d< acidification puis laisse libre lors de la phase 
alcaline. Les bacteries ont ete prelevees apres quatre 
heures d'induction, alors que le pH etait de 8,3. La 
culture a ensuite ete centrifugee puis les cellules ont 
ete divisees en trois lots. L'un d'eux, 20 g de pate, a 
ete repris dans 80 ml de tampon de lyse pour un 
traitement ulterieur indique au chapitre Materiel et 
methodes . 

C) Purification rt» 1' ADN nnlymerasP Ho T 

fumicolans . 

La purification a ete effectuee comme indique 
precedemment (Materiel et Methodes) . Pour la colonne 
Heparine -Sepharose, un gradient de 3 a 50% de tampon B, 
correspondant aux volume 3 65 ml a 13 63 ml, permet de 
recuperer 73 fractions de 6 ml . Le pic d'activite de la 
polymerase est obtenu pour une valeur de gradient de 0,5 
M environ, et correspond aux fractions 55/56 (dosees a 
10 et 12 unites respectivement ) comme indique a la figure 
7. Ces fractions, incubees a 37°C pendant la nuit en 
presence d'ADN de pBR322, degradent 1 ' ADN et presentent 
en consequence des traces de nuclease de l'hote, non 
visibles sur gel. Leur elimination, ou tout au moins une 
reduction substancielle de leur concentration a ete 
realisee par un passage sur colonne d'af finite (Bleue 
Hi trap) . 

Les fractions 54 a 60, regroupees et dialysees, 
sont chargees a raison de 0,25 ml/mn. L'elution permet 
de recuperer 65 fractions de 5 ml avec des pics 
d'activite pour les fractions 3 6 a 56. Le dosage de 



WO 98/49274 



28 



PCI7FR97/00761 



1'activite fait apparaitre une concentration de 3 k 5 
unites pour les fractions 36 a 40. Ces fractions, mises 
en presence d'ADN a 37°C, pressentent une faible activite 
nucleasique. 

Neanmoins, 1'activite sur le plasmide pBR322 a 
37°C toute la nuit montre une nette amelioration de la 
purete de 1' enzyme. Une deuxieme colonne Bleue Hi Trap a 
ete reutilisee en prenant les fractions 36 a 44 et 
dialysees comme pr^cedemment . 2 5ml sur les 3 0ml de 
fraction ont ete injectes sur la colonne avec un d6bit de 
0,25ml/min (5 ml etant gardes pour essayer une MonoQ) . 
Apres cette deuxieme colonne Bleue HiTrap, 1'activite sur 
le plasmide pBR322 ferme et incube toute la nuit avec des 
fractions de la colonne, est nulle. L' incubation d'une 
heure a 72°C de fractions avec l'ADN de Lambda digere par 
Hindlll montre une tres nette degradation, mettant en 
evidence 1'activite exonuclease 3 '-5' associee a notre 
ADN polymerase. Le pic d' activite se situe entre les 
fractions 27 et 32. L'ADN polymerase plus pure est done 
sortie plus t6t sur le gradient de NaCl. Sur les 
fractions les plus actives, un comptage a ete realise 
donnant une activite superieure a 5U/ul pour les 
fractions 29, 30 et 31. La figure 4 montre le resultat 
sur gel SDS-PAGE. Suite a ces trois colonnes, la purete 
de la polymerase est nettement am^lioree. Neanmoins, il 
reste des traces d'ADN de E.coli fixe k la polymerase et 
mises en evidence par PGR. Deux colonnes supplementaires 
vont done £tre mis en oeuvre. 3 0ml de fractions actives 
obtenues precedemment sont chargees sur une colonne de 
phosphocellulose (celle-ci devrait fixer differemment 
l'ADN et la polymerase). L'activite de la polymerase est 
reper^e par son activite exonucleasique 3 '-5' elevee a 
72°C sur l'ADN de Lambda dig6re par Hindlll. L'activite 
la plus forte se situe entre les fractions 40 et 49 avec 
un pic net en 46 et 47. Sur ces fractions 40 a 49 l'ADN 
de pBR322 est intact apres une nuit a 37°C. La figure 5 
nous montre les resultats sur gel avec des activites 
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mesurees de 6U/yl pour la fraction 46, 4,5U/ul pour la 47 
et 3U/yl pour la 48. Neanmoins il reste encore des traces 
d'ADN de E. coli. 

Ayant deja mis en evidence que cette polymerase 
ne se fixe pas sur une MonoQ ou une ressource Q et ce 
quel que soit le pH utilise, nous avons essaye de la 
recuperer en exclusion en esperant une fixation de 1'ADN 
contaminant par la colonne. 

Tout d'abord un essai a ete realise en sortie 
de la deuxieme Bleue HiTrap avec 5ml dialyses Les 
resultats ont ete decevants, les fractions d' exclusion 
etant peu actives en incorporation. 

Une deuxieme tentative a ete realisee apres la 
phosphocellulose et apres deux dialyses des fractions les 
plus actives 45 , 46 et 49. Les fractions sont tout 
d'abord chauffees 40 min a 85°C en raison d'une detection 
de contaminant degradant le pBR322 a 72 °C en une nuit. 
Aucune floculation n'est alors visible et 1'extrait est 
mis sur glace. Un nouveau test demontre que la 
contamination semble reduite. Apres les dialyses et le 
passage sur colonne, 1 'activity exonucleasique est mise 
en evidence sur les fractions d' exclusion 3 a 7. 
L'activite est dosee a 2U/yl et 1' enzyme est visualisee 
sur la figure 10. Suite a cette derniere etape de 
purification, nous avons obtenu des resultats positifs en 
PCR et comparables a ceux obtenus pour la Vent. 

d > Caracterisation ri^s acHv^ j des fracMnng 

purifi^es. 

L'activite de 1'ADN polymerase des differentes 
fractions a 6t6 dosee par incorporation au 32 P dATP selon 
le protocole decrit en Materiel et Methodes. 

- Amplification d e genes j n vit-rn. 
Un fragment de 459 pb a ete amplifie a partir 
d'un ADN genomique d' Archaebacterie (Thermococcus sp. GE 
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8) avec des amorces specifiques. Differents tampons ont 
ete utilises: 

- tampon lOx R: Tris HC1 pH 8,8: 300mM; KC1 : 
500mM; MgC12 : 30mM; Tween 20: 0,1% 

- tampon lOx H: Tris HC1 : pH 8,8: 300 mM; KC1: 
500mM; MgC12 : 15mM; Tween 20: 0,1% 

- tampon lOx T: Tris HC1 pH 8,8: 600mM; KC1 : 
500mM; MgC12 : 15mM; Tween 20: 0,1% 

- tampon lOx S: Tris Hcl pH 8,8: 200mM; KC1 : 
250mM; MgC12 : 20mM; Tween 20: 0,1% 

Trente cycles ont ete realises, chacun 
comprenant une etape de denaturation a 94°C pendant 30 
sec, une etape d'hybridation des amorces a 51°C pendant 
1 min. puis une etape d' elongation a 72°C pendant 2 min. 
La figure 8 presente les resultats obtenus avec un volume 
reactionnel de 50 ul pour des quantites d'ADN polymerase 
de Thermococcus fumicolans de 2,7 unites. En l'etat 
actuel, les meilleurs resultats avec la Tfu sont obtenus 
avec le tampon R. 

La figure 9 represente les resultats de 
1' amplification d'un fragment de 1,6 kb avec la Tfu 
purifiee sur colonnes d'heparine puis de sephacryl-bleue, 
et un tampon reactionnel lOx ayant la composition 
suxvante: Tris HC1 pH 8,8: 200mM; KC1 : lOOmM; (NH 4 )2S0 4 : 
lOOmM; MgS04: 20mM; Triton X-100: 1%. 

" Activit e exonn<- leasiaue 

Les tests d' activite, selon le protocole 
detaille en Materiels et Methodes, ne revelent pas 
d' activite exonucleasique 5 '-3' chez la Tfu. Ceci est en 
conformite avec la structure de 1' enzyme deduite de 
1' analyse de la sequence polypeptidique qui ne fait pas 
apparaitre de domaine fonctionnel exonuclease 5 '-3', 
contrairement a ce qui est observe pour DNA poll de E. 
coli et la Taq. 

Les tests d' activite, selon le protocole 
detaille au chapitre Materiels et Methodes, font 
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apparaitre une activite exonucleasique 3 '-5' (activite 
proof-reading ou de correction d'erreurs) chez la Tfu, a 
un niveau sensiblement egal a celui de la Vent comme 
montre dans le tableau 4 ci-dessous. Le tableau 4 
rapporte la mesure de 1'actvite exonucleasique 3 '-5' de 
la Tfu en fonction de la concentration en dNTP, et en 
comparaison avec la Vent. 

Tableau 4 



Cone. dNTP 
i (mM) 


Tfu 


Temoin + 
(Vent) 


Temoin - 
(Pab exo-) 


0 


30 000 


25 000 


100 000 ! 


0,1 


40 000 




0,2 


40 000 


56 000 




0,3 


40 000 


58 000 




0,4 


40 000 


70 000 




0,5 








0.75 


40 000 


84 000 




1 


90 000 


106 000 


100 000 



Ces resultats sont en conformite avec la 
structure de 1' enzyme deduite de 1' analyse de la sequence 
polypeptidique qui revele la presence d'un domaine 
exonucleasique 3' -5' en position N-terminale, ainsi que 
la presence des motifs catalytiques caracteristiques de 
ce domaine. La Tfu est sensible a une concentration de 
l'ordre de 0,8 mM de dNTP, tandis que la Vent manifeste 
une sensibilite des 0,5 mM. Cette activite est connue 
pour ameliorer in vitro la fidelite des polymerases 
utilisees en PCR. 

En outre, cette activite exonucleasique est 
confirmee par un test plus simple. Les fractions 
purifi<§es, depourvues d'activit(§ nucleasique a 37°C, 
mises en presence d'ADN de digere par Hindlll puis 
expose & 72°C pendant la nuit, degradent completement cet 
ADN, mettant ainsi en evidence la presence de 1' activite 
3 '-5' exonuclease de la Tfu ainsi que sa 
thermostability . 



- Thermostability 
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La thermostability mesuree selon le protocole 
decrit precedemment (Materiel et Methodes) , pu mieux, 
l'activite residuelle en incorporation a 72°C apres 
exposition de 1' enzyme a des temperatures elevees pendant 
des temps variables, est donnee dans le tableau 5 ci- 
dessous . 

Tableau S 



Temperature 
<°C) 


Demi-vie 
polymerase 


Activite exo 
aores 3h 


92 




100% 


95 


4 h 




100 


2 h 





Cette thermostabilite, inferieure a celle des 
polymerases issues d'organismes plus hyperthermophiles 
tels que les Pyrococcus, n'en demeure pas moins tres 
largement superieure a celles des polymerases issues des 
Thermus et en particulier toutes les Taq. La 
thermostabilite de 1' enzyme recombinante purifiee, tant 
pour le domaine polymerase que pour l'exonuclease, est de 
toute maniere tres largement superieure a tous les 
besoins connus en PCR. 
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LISTE DE SEQUENCES 

(1) INFORMATION GENERALES : 

(i) DEPOSANT : APPLIGENE - ONCOR 

(ii) TITRE DE L 1 INVENTION : ADN POLYMERASE 
THERMOSTABLE D ' ARCHAEBACTERIES DE L ' ESPECE 
THERMOCOCCUS fvmicolans 

(iii) NOMBRE DE SEQUENCES: 4 



(2) INFORMATION POUR LA SEQ ID NO:l : 

(i) CARACTRERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 5039 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: sequence codante de 1 1 ADN 
polymerase de THERMOCOCCUS fvmicolans Tfu 

(B) EMPLACEMENT :de 457 a 5028 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: sequence codante de 1 1 inteine 
I-Tfu-1 

(B) EMPLACEMENT: de 1675 a 2754 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: sequence codante de 1 ' inteine 
I-Tfu-2 

(B) EMPLACEMENT: de 3157 a 4323 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: codon stop 

(B) EMPLACEMENT: de 5026 a 5028 

(xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO : 1 : 

AGCTTAAAGC GTCCGCCACT ACTTCCTGAA AGCTCACGCG GTAAAACAGC TCCATGCTCG 60 

GCTCTTCGAT GGGAGGTTTA AAAAGGTGGT GGTGAGGTTT ATTAGGAAGA AGGCTCAACT 120 

AGAGACGGTG GGAGTATGGA AGAGGTCGAC AGGCTCGTGT TCAACTTTCC CCTCTTCAAA 180 

GATTACTGGG AAAAGGAGCG GTTCCTCAAG GTCGTTGGGC TTCTGGTGAG CCACCAGATA 240 

ACGTTTGAGA AAGCTGC CGA GCTTCTGGAC ATGAGGCTCG AAGAGCTGGC GTTCCTCCTT 3 00 

GACAAGCTCG GCGTTGAGTA CTCGCTTCTT GATGATGAAG AGGCCAGACT TGAGAGAGAA 3 60 

GAGGCCAATA AGCTCATGGG GGAAATGAAG GGTGGAGCGT TTGTCTGATT CTTCTGAGCT 420 

GTTATTGGTG TTTCACAGGC TGGGAGGTGG TGGATT ATG ATC CTC GAT ACA GAC 474 

Met He Leu Asp Thr Asp 
1 5 

TAC ATC ACC GAA GAC GGA AGG CCC GTC ATC AGG GTG TTC AAG AAG GAG 522 
Tyr He Thr Glu Asp Gly Arg Pro Val He Arg Val Phe Lys Lys Glu 
10 15 20 
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AAC GGC GAG TTC AAA ATC GAG TAC GAC AGG GAC TTC GAG CCT TAC ATC 570 
Asn Gly Glu Phe Lys He Glu Tyr Asp Arg Asp Phe Glu Pro Tyr lie 
25 30 35 

TAC GCT CTC CTG AAG GAC GAT TCC GCG ATC GAG GAC GTC AAG AAG ATA 618 
Tyr Ala Leu Leu Lys Asp Asp Ser Ala He Glu Asp Val Lys Lvs He 
40 45 50 

ACT GCA AGC CGG CAC GGT ACC ACC GTC AGG GTC GTC AGG GCC GGG AAG 666 
Thr Ala Ser Arg His Gly Thr. Thr Val Arg Val Val Arg Ala Gly Lys 
55 60 65 70 

GTG AAG AAG AAG TTC CTC GGC AGG CCG ATA GAG GTC TGG AAG CTC TAC 714 
Val Lys Lys Lys Phe Leu Gly Arg Pro He Glu Val Trp Lys Leu Tyr 
75 80 85 

TTC ACC CAT CCC CAG GAC GTT CCG GCA ATC AGG GAC AAA ATC AGG GAG 762 
Phe Thr His Pro Gin Asp Val Pro Ala He Arg Asp Lys He Arg Glu 
90 95 100 

CAC CCT GCC GTG GTC GAC ATA TAT GAG TAC GAC ATA CCC TTT GCC AAG 
His Pro Ala Val Val Asp He Tyr Glu Tyr Asp He Pro Phe Ala Lys 
105 no 115 

CGC TAC CTC ATC GAT AAG GGC CTC ATC CCG ATC GAG GGC GAC GAG GAG 
Arg Tyr Leu He Asp Lys Gly Leu He Pro Met Glu Gly Asp Glu Glu 
120 125 130 



810 



858 



CTC AAG ATG CTC GCC TTC GAC ATC GAG ACG CTC TAC CAC GAG GGC GAG 906 

Leu Lys Met Leu Ala Phe Asp He Glu Thr Leu Tyr His Glu Gly Glu 
135 140 145 y 15Q 

GAG TTC GCC GAG GGG CCT ATT CTT ATG ATA AGC TAT GCC GAC GAG GAA 954 

Glu Phe Ala Glu Gly Pro He Leu Met He Ser Tyr Ala Asp Glu Glu 
155 160 165 

GGG GCG AGG GTA ATA ACC TGG AAG AAG ATC GAC CTT CCC TAC GTT GAC 1002 

Gly Ala Arg Val He Thr Trp Lys Lys He Asp Leu Pro Tyr Val Asd 
170 175 180 

GTC GTT TCA ACG GAG AAG GAG ATG ATA AAG CGC TTC CTG AAG GTT GTC 1050 

Val Val Ser Thr Glu Lys Glu Met He Lys Arg Phe Leu Lys Val Val 
185 190 195 

AAG GAG AAG GAC CCC GAT GTC CTC ATA ACC TAC AAC GGC GAC AAC TTC 1098 

Lys Glu Lys Asp Pro Asp Val Leu lie Thr Tyr Asn Gly Asp Asn Phe 

200 205 210 

GAC TTC GCT TAC CTC AAG AAG CGC TCC GAG AAG CTC GGC GTT AAG TTC 1146 

Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu Lys Leu Gly Val Lys Phe 
215 220 225 230 

ATC CTC GGA AGG GAC GGC AGC GAG CCG AAG ATA CAG AGG ATG GGC GAC 1194 

He Leu Gly Arg Asp Gly Ser Glu Pro Lys He Gin Arg Met Gly Asp 
235 240 245 

CGC TTC GCC GTC GAG GTG AAG GGA AGA ATA CAC TTC GAC CTC TAC CCC 1242 

Arg Phe Ala Val Glu Val Lys Gly Arg lie His Phe Asp Leu Tyr Pro 
250 255 260 
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GTC ATA AGA CAC ACC ATC AAC CTG CCC ACC TAC ACG CTG GAG GCC GTC 1290 
Val lie Arg His Thr He Asn Leu Pro Thr Tyr Thr Leu Glu Ala Val 
265 270 275 

TAC GAG GCG ATT TTT GGG CAG CCA AAG GAG AAG GTC TAC GCT GAG GAG 1338 
Tyr Glu Ala lie Phe Gly Gin Pro Lys Glu Lys Val Tyr Ala Glu Glu 
280 285 290 

ATA GCG CAG GCC TGG GAA ACG GGC GAG GGG CTT GAG CGC GTC GCG CGC 
lie Ala Gin Ala Trp Glu Thr Gly Glu Gly Leu Glu Arg Val Ala Arg 
295 300 305 310 

TAC TCG ATG GAG GAC GCC AAG GTA ACC TAC GAG CTG GGA AGG GAG TTC 1434 
Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr Glu Leu Gly Arg Glu Phe 
315 320 325 

TTC CCG ATG GAG GCC CAA CTT TCT CGG CTG GTC GGT CAG AGC TTC TGG 
Phe Pro Met Glu Ala Gin Leu Ser Arg Leu Val Gly Gin Ser Phe Tro 
330 335 " 340 

GAC GTC TCG CGC TCC AGC ACC GGC AAC CTC GTC GAG TGG TAC CTC CTC 1530 
Asp Val Ser Arg Ser Ser Thr Gly Asn Leu Val Glu Trp Tyr Leu Leu 
345 350 355 

AGG AAG GCC TAC GAG AGG AAC GAG CTG GCA CCG AAC AAG CCC TCC GGC 1578 
Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala Pro Asn Lys Pro Ser Gly 
360 365 370 

AGA GAA CTT GAG AGG CGC CGC GGG GGC TAC GCC GGC GGC TAC GTC AAG 1626 
Arg Glu Leu Glu Arg Arg Arg Gly Gly Tyr Ala Gly Gly Tyr Val Lys 
375 400 405 410 

GAG CCG GAG AGG GGA CTT TGG GAG AAC ATA GCT TAT TTA GAT TTT AGG 1674 
Glu Pro Glu Arg Gly Leu Trp Glu Asn lie Ala Tyr Leu Asp Phe Arg 
415 420 425 

TGT. CAT CCT GCC GAC ACT AAA GTC ATT GTC AAA GGG AAG GGC GTT GTA 1722 
Cys His Pro Ala Asp Thr Lys Val He Val Lys Gly Lys Gly Val Val 
430 435 440 

AAC ATC AGC GAA GTT AGG GAG GGG GAC TAC GTT CTC GGC ATA GAC GGC 1770 
Asn He Ser Glu Val Arg Glu Gly Asp Tyr Val Leu Gly lie Asp Gly 
445 450 455 

TGG CAG AAG GTT CAA AGG GTC TGG GAG TAT GAT TAC GAG GGA GAA CTC 1818 
Trp Gin Lys Val Gin Arg Val Trp Glu Tyr Asp Tyr Glu Gly Glu Leu 
460 465 470 

GTA AAT ATA AAC GGC CTT AAG TGC ACA CCG AAC CAT AAG CTT CCG GTC 1866 
Val Asn lie Asn Gly Leu Lys Cys Thr Pro Asn His Lys Leu Pro Val 
475 480 4 8 5 4go 

GTT AGG AGG ACT GAG AGG CAG ACT GCG ATA AGG GAC AGC CTT GCA AAG 1914 
Val Arg Arg Thr Glu Arg Gin Thr Ala lie Arg Asp Ser Leu Ala Lys 
495 500 505 

TCT TTT CTC ACG AAA AAA GTT AAA GGT AAG CTG ATA ACC ACG CCT CTC 1962 
Ser Phe Leu Thr Lys Lys Val Lys Gly Lys Leu He Thr Thr Pro Leu 
510 515 520 
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TTT GAA AAA ATC GGG AAG ATC GAG CGA GAG GAC GTC CCA GAA GAG GAG 2010 
Phe Glu Lys He Gly Lys He Glu Arg Glu Asp Val Pro Glu Glu Glu 
525 5 3o 535 

ATA CTC AAA GGA GAA CTC GCC GGA ATA ATC CTG GCT GAG GGC ACA CTC 2058 
lie Leu Lys Gly Glu Leu Ala Gly He lie Leu Ala Glu Gly Thr Leu 
540 545 550 

CTG AGA AAG GAT GTC GAG TAC TTT GAC TCT TCC AGA GGG AAG AAG AGA 
Leu Arg Lys Asp Val Glu Tyr Phe Asp Ser Ser Arg Gly Lys Lys Arg 
555 560 565 570 

GTA TCA CAC CAG TAC AGG GTT GAA ATA ACC GTT GGG GCG CAG GAG GAG 2154 
Val Ser His Gin Tyr Arg Val Glu He Thr Val Gly Ala Gin Glu Glu 
575 580 585 

GAC TTC CAG AGG AGG ATC GTT TAC ATT TTC GAA CGC CTC TTT GGG GTA 2202 
Asp Phe X Arg Arg He Val Tyr He Phe Glu Arg Leu Phe Gly Val 
590 595 600 

ACT CCC AGT GTT TAC CGG AAA AAG AAC ACA AAC GCA ATA ACG TTC AAA 2250 
Thr Pro Ser Val Tyr Arg Lys Lys Asn Thr Asn Ala He Thr Phe Lvs 
60S 610 615 

GTT GCC AAA AAA GAG GTT TAT CTT AGG GTT AGG GAA ATT ATG GAT GGC 2298 
Val Ala Lys Lys Glu Val Tyr Leu Arg Val Arg Glu He Met Asp Gly 
"0 625 630 

ATT GAG AAC CTC CAC GCT CCT TCT GTG TTA AGG GGC TTT TTT GAA GGA 2346 
He Glu Asn Leu His Ala Pro Ser Val Leu Arg Gly Phe Phe Glu Gly 
635 640 645 650 

GAC GGA AGC GTC AAC AAG GTC CGG AAG ACA GTG GTA GTG AAT CAG GGC 2394 
Asp Gly Ser Val Asn Lys Val Arg Lys Thr Val Val Val Asn Gin Gly 
655 660 665 

ACC AAT AAT GAA TGG AAA ATT GAA GTG GTG TCA AAA CTC CTC AAC AAG 2442 
Thr Asn Asn Glu Trp Lys He Glu Val Val Ser Lys Leu Leu Asn Lys 
670 675 680 

TTG GGG ATT CCG CAT AGA AGG TAC ACA TAC GAT TAC ACC GAA AGA GAA 2490 
Leu Gly He Pro His Arg Arg Tyr Thr Tyr Asp Tyr Thr Glu Arg Glu 
685 690 695 

AAA ACC ATG ACA ACG CAT ATA CTT GAG ATA GCC GGC AGG GAT GGG TTA 2538 
Lys Thr Met Thr Thr His He Leu Glu He Ala Gly Arg Asp Gly Leu 
700 705 710 

ATC CTT TTC CAG ACC ATT GTG GGA TTC ATA AGC ACT GAG AAG AAC ATG 2586 
He Leu Phe Gin Thr He Val Gly Phe lie Ser Thr Glu Lys Asn Met 
715 7 20 725 730 

GCG CTG GAG GAG GCA ATC AGG AAC AGG GAA GTG AAC CGC CTA GAA AAC 2634 
Ala Leu Glu Glu Ala He Arg Asn Arg Glu Val Asn Arg Leu Glu Asn 
7 35 740 745 

AAT GCC TTC TAT ACC CTA GCC GAC TTT ACG GCG AAG ACA GAG TAC TAC 2682 
Asn Ala Phe Tyr Thr Leu Ala Asp Phe Thr Ala Lys Thr Glu Tyr Tyr 
750 755 " 780 
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AAG GGC AAA GTT TAC GAC TTA ACC CTT GAG GGA ACG CCC TAT TAC TTC 2730 
Lys Gly Lys Val Tyr Asp Leu Thr Leu Glu Gly Thr Pro Tyr Tyr Phe 
785 790 795 

GCC AAT GGC ATA CTG ACC CAC AAT T£S CTA TAT CCT TCG ATT ATA ATT 
Ala Asn Gly He Leu Thr His Asn Ser Leu Tyr Pro Ser He He He 
800 805 810 

TCC CAC AAC GTC TCC CCC GAT ACG CTC AAC CGC GAG GGC TGC GGG GAG 2826 
Ser His Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Gly Glu 
815 820 825 830 

TAC GAC GAG GCT CCG CAG GTA GGG CAT CGC TTT TGT AAG GAC TTC CCC 2874 
Tyr Asp Glu Ala Pro Gin Val Gly His Arg Phe Cys Lys Asp Phe Pro 
835 840 845 

GGC TTC ATC CCC AGC CTC CTC GGT GAC CTG CTC GAC GAG AGG CAG AAG 2922 
Gly Phe He Pro Ser Leu Leu Gly Asp Leu Leu Asp Glu Arg Gin Lvs 
855 860 865 

GTA AAG AAG CAC ATG AAG GCC ACG GTG GAC CCG ATA GAG AAG AAG CTC 2970 
Val Lys Lys His Met Lys Ala Thr Val Asp Pro He Glu Lys Lvs Leu 
870 875 880 

CTC GAT TAC AGG CAG CGC GCA ATT AAA ATC CTC GCC AAC AGC TTC TAC 3018 
Leu Asp Tyr Arg Gin Arg Ala He Lys He Leu Ala Asn Ser Phe Tvr 
885 890 895 

GGC TAC TAT GGC TAC GCA AAG GCC CGC TGG TAC TGC AAG GAG TGC GCC 3066 
Gly Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala 
900 90S 9 10 915 

GAG AGC GTT ACC GCC TGG GGC AGG CAG TAC ATT GAG ACC ACC ATG AGG 3114 
Glu Ser Val Thr Ala Trp Gly Arg Gin Tyr He Glu Thr Thr Met Arg 
920 925 930 

GAA ATA GAG GAA AAA TTT GGC TTT AAA GTG CTG TAC GCG GAT AQJ. GTT 3162 
Glu He Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Ser Val 
935 940 945 

ACA GGG GAC ACA GAG GTA ACC ATC AGA AGA AAC GGC AGG ATT GAG TTC 3210 
Thr Gly Asp Thr Glu Val Thr He Arg Arg Asn Gly Arg He Glu Phe 
950 955 9 6 o 

GTT CCA ATC GAG AAA CTC TTT GAG CGC GTT GAT CAC CGT GTT GGT GAG 3258 
Val Pro He Glu Lys Leu Phe Glu Arg Val Asp His Arg Val Gly Glu 
96S 970 975 

AAG GAG TAC TGC GTT CTT GGA GGG GTT GAG GCA CTG ACA CTC GAC AAC 33 06 
Lys Glu Tyr Cys Val Leu Gly Gly Val Glu Ala Leu Thr Leu Asp Asn 
980 985 990 995 

AGG GGC AGG CTC GTG TGG AAG AAG GTT CCG TAC GTC ATG AGA CAT AAA 
Arg Gly Arg Leu Val Trp Lys Lys Val Pro Tyr Val Met Arg His Lys 
1000 1005 1010 

ACG GAC AAA AGA ATC TAT AGG GTA TGG TTC ACC AAC TCT TGG TAC CTT 3402 
Thr Asp Lys Arg He Tyr Arg Val Trp Phe Thr Asn Ser Trp Tyr Leu 
1015 1020 1025 



3354 
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GAG GAT C AC TCG CTA ATA GGC TAC CTG AAC ACA AGC AAA 3450 
Asp Val Thr Glu Asp His Ser Leu He Gly Tyr Leu Asn Thr Ser Lys 
1030 1035 1040 

GTC AAA CCC GGA AAG CCC TTG AAA GAG CGT CTC GTC GAG GTC AAG CCA 3498 
Val Lys Pro Gly Lys Pro Leu Lys Glu Arg Leu Val Glu Val Lys Pro 
1045 1050 1055 

GAA GAA TTG GGG GGT AAG GTC AAG TCT CTC ATT ACG CCC AAT CGG CCA 3 546 
Glu Glu Leu Gly Gly Lys Val Lys Ser Leu lie Thr Pro Asn Arg Pro 
1060 1065 1070 1075 

ATT GCC CGT ACC ATC AAG GCC AAC CCC ATT GCC GTC AAG CTC TGG GAG 3 594 
He Ala Arg Thr He Lys Ala Asn Pro He Ala Val Lys Leu Trp Glu 
1080 1085 1090 

TTA ATT GGC CTG CTG GTG GGA GAT GGC AAC TGG GGT GGA CAA TCG AAC 3642 
Leu He Gly Leu Leu Val Gly Asp Gly Asn Trp Gly Gly Gin Ser Asn 
1095 HOO H05 

TGG GCC AAA TAC TAC GTT GGC CTC TCC TGT GGG CTG GAT AAA GCC GAA 3690 
Trp Ala Lys Tyr Tyr Val Gly Leu Ser Cys Gly Leu Asp Lys Ala Glu 
1U° 1H5 H20 

ATA GAG AG A AAA GTC CTG AAC CCT TTA AGA GAG GCA AGC GTC ATC TCC 3738 
He Glu Arg Lys Val Leu Asn Pro Leu Arg Glu Ala Ser Val He Ser 
1125 H30 H35 

AAC TAC TAC GAC AAG AGC AAG AAG GGC GAC GTT TCC ATA CTC TCC AAG 3786 
Asn Tyr Tyr Asp Lys Ser Lys Lys Gly Asp Val Ser He Leu Ser Lvs 
H40 1145 H50 ii55 

TGG CTC GCC GGA TTC ATG GTC AAA TAC TTC AAA GAT GAA AAT GGG AAC 3834 
Trp Leu Ala Gly Phe Met Val Lys Tyr Phe Lys Asp Glu Asn Gly Asn 
H60 H65 H70 

AAG GCC ATT CCC AGC TTC ATG TTC AAC CTT CCA AGG GAA TAC ATA GAG 3882 
Lys Ala He Pro Ser Phe Met Phe Asn Leu Pro Arg Glu Tyr He Glu 
1175 H80 H85 

GCC TTT CTA CGG GGG CTG TTT TCA GCG GAC GGA ACG GTA AGC TTG CGT 3 930 
Ala Phe Leu Arg Gly Leu Phe Ser Ala Asp Gly Thr Val Ser Leu Arq 
H90 H95 1200 

AGA GGA ATC CCA GAA ATT AGA CTG ACA AGC GTT AAC AGA GAG CTT AGT 3 978 
Arg Gly He Pro Glu He Arg Leu Thr Ser Val Asn Arg Glu Leu Ser 
1205 1210 1215 

GAT GCC GTG AGA AAG TTG CTG TGG CTG GTT GGG GTC TCC AAC TCA CTA 4 026 
Asp Ala Val Arg Lys Leu Leu Trp Leu Val Gly Val Ser Asn Ser Leu 
1220 1225 1230 1235 

TTC ACC GAA ACC AAG CCA AAC CGG TAC CTG GAG AAA GAA AGT GGA ACG 4074 
Phe Thr Glu Thr Lys Pro Asn Arg Tyr Leu Glu Lys Glu Ser Gly Thr 
1240 1245 1250 

CAT TCG ATT CAC GTG AGG ATA AAG AAC AAG CAT CGC TTT GCC GAT AGA 4122 
His Ser He His Val Arg He Lys Asn Lys His Arg Phe Ala Asp Arg 
1255 1260 1265 
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ATA GGC TTT CTC ATA GAC AGA AAA TCC ACC AAA CTC TCC GAG AAC CTG 4170 
lie Gly Phe Leu He Asp Arg Lys Ser Thr Lys Leu Ser Glu Asn Leu 
1270 1275 1280 

GGG GGA CAT ACA AAC AAG AAG AGG GCT TAC AAA TAT GAT TTT GAC TTG 4218 
Gly Gly His Thr Asn Lys Lys Arg Ala Tyr Lys Tyr Asp Phe Asp Leu 
1285 1290 1295 

GTA TAC CCC AGA AAA ATC GAA GAG ATA ACC TAC GAC GGC TAC GTC TAT 4266 
Val Tyr Pro Arg Lys lie Glu Glu He Thr Tyr Asp Gly Tyr Val Tvr 
"00 1305 1310 1315 

GAC ATC GAG GTT GAG GGA ACC CAC AGG TTC TTC GCC AAC GGA ATA CTC 4314 
Asp He Glu Val Glu Gly Thr His Arg Phe Phe Ala Asn Gly He Leu 
1320 1325 133b 

GTT CAC AAC A£A GAC GGC TTT TTC GCA ACA ATC CCC GGA GCG GAC GCC 4362 
Val His Asn Thr Asp Gly Phe Phe Ala Thr He Pro Gly Ala Asp Ala 
1335 1340 1345 

GAG ACG GTC AAA AAG AAG GCC AGG GAG TTC CTT AAC TAC ATT AAC CCC 4410 
Glu Thr Val Lys Lys Lys Ala Arg Glu Phe Leu Asn Tyr He Asn Pro 
1350 1355 1360 

AAG CTG CCC GGT CTC CTC GAA CTC GAG TAC GAG GGC TTC TAC AGG CGC 4458 
Lys Leu Pro Gly Leu Leu Glu Leu Glu Tyr Glu Gly Phe Tyr Arq Arq 
1365 1370 1375 

GGT TTC TTC GTA ACC AAG AAG AAG TAC GCG GTG ATA GAC GAG GAG GGC 4506 
Gly Phe Phe Val Thr Lys Lys Lys Tyr Ala Val He Asp Glu Glu Glv 
1380 1385 1390 1395 

AAG ATA ACG ACG CGC GGG CTT GAG ATC GTC CGG CGC GAC TGG AGT GAG 4 554 
Lys He Thr Thr Arg Gly Leu Glu He Val Arg Arg Asp Trp Ser Glu 
1400 1405 ~ 1410 

GTG GCT AAG GAG ACG CAG GCG AGG GTC TTG GAG GCC ATA CTG CGG CAC 4602 
Val Ala Lys Glu Thr Gin Ala Arg Val Leu Glu Ala He Leu Arg His 
1415 1420 1425 

GGT GAC GTC GAG GAG GCC GTG AGG ATT GTC AAG GAA GTG ACG GAA AAG 4650 
Gly Asp Val Glu Glu Ala Val Arg He Val Lys Glu Val Thr Glu Lys 
1430 1435 1440 

CTG AGC AAG TAC GAG GTT CCG CCA GAG AAG CTC GTC ATC CAC GAG CAG 4698 
Leu Ser Lys Tyr Glu Val Pro Pro Glu Lys Leu Val He His Glu Gin 
1445 1450 1455 

ATT ACC AGG GAG CTG AAG GAC TAC AAG GCC ACC GGC CCG CAC GTG GCC 4746 
He Thr Arg Glu Leu Lys Asp Tyr Lys Ala Thr Gly Pro His Val Ala 
1460 1465 1470 i4 75 

ATA GCG AAG CGC CTC GCC GCG AGG GGG ATT AAG GTT CGC CCT GGG ACA 4794 
He Ala Lys Arg Leu Ala Ala Arg Gly He Lys Val Arg Pro Gly Thr 
1480 1485 1490 

GTC ATC AGC TAC ATC GTC CTG AAA GGT TCC GGC AGG ATA GGG GAC AGG 4842 
Val He Ser Tyr He Val Leu Lys Gly Ser Gly Arg He Gly Asp Arg 
1495 1500 1505 
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ACG ATA CCC TTC GAC GAG TTC GAC CCC ACG AAG CAC AGG TAC GAT GCG 4890 
Thr lie Pro Phe Asp Glu Phe Asp Pro Thr Lys His Arg Tyr Asp Ala 
1510 1515 1520 

GAG TAC TAC ATC GAG AAC CAG GTT CTG CCG GCG GTG GAG AGA ATC CTC 4938 
Glu Tyr Tyr lie Glu Asn Gin Val Leu Pro Ala Val Glu Arg lie Leu 
1525 1530 1535 

AAG GCC TTC GGC TAC AAG AAG GAG GAT TTG CGC TAC CAG AAG ACG CGG 4986 
Lys Ala Phe Gly Tyr Lys Lys Glu Asp Leu Arg Tyr Gin Lys Thr Ara 
1540 1545 1550 15 55 

CAG GTT GGG CTG GGG GCG TGG CTC AAA ATG GGG AAG AAA !£QA 5028 
Gin Val Gly Leu Gly Ala Trp Leu Lys Met Gly Lys Lys 
1560 i5 6 5 1568 

AGGCCAAGCT T 



5039 



(2) INFORMATION POUR LA SEQ ID NO: 2 : 

(i) CARACTRERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 774 acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: ADN polymerase de THERMOCOCCUS 
fvmicolans Tfu 
(xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO: 2 : 

Met He Leu Asp Thr Asp Tyr He Thr Glu Asp Gly Arg Pro Val He 
1 5 10 is 

Arg Val Phe Lys Lys Glu Asn Gly Glu Phe Lys lie Glu Tyr Asp Arc 
20 25 30 

Asp Phe Glu Pro Tyr He Tyr Ala Leu Leu Lys Asp Asp Ser Ala He 
35 40 45 

Glu Asp Val Lys Lys He Thr Ala Ser Arg His Gly Thr Thr Val Ara 
50 55 60 

Val Val Arg Ala Gly Lys Val Lys Lys Lys Phe Leu Gly Arg Pro He 
65 70 75 80 

Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gin Asp Val Pro Ala He 
85 90 95 

Arg Asp Lys He Arg Glu His Pro Ala Val Val Asp He Tyr Glu Tvr 
100 105 no 

Asp He Pro Phe Ala Lys Arg Tyr Leu He Asp Lys Gly Leu He Pro 
115 120 125 

Met Glu Gly Asp Glu Glu Leu Lys Met Leu Ala Phe Asp He Glu Thr 
130 135 140 

Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro He Leu Met He 
145 150 155 i 6 o 

Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val He Thr Trp Lys Lys He 
165 170 175 
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Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Lys Glu Met lie Lys 
180 185 190 

Arg Phe Leu Lys Val Val Lys Glu Lys Asp Pro Asp Val Leu He Thr 
195 200 205 

Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu 
210 215 220 

Lys Leu Gly Val Lys Phe lie Leu Gly Arg Asp Gly Ser Glu Pro Lys 
225 230 235 240 

He Gin Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg He 
245 250 255 

His Phe Asp Leu Tyr Pro Val lie Arg His Thr lie Asn Leu Pro Thr 
260 265 270 

Tyr Thr Leu Glu Ala Val Tyr Glu Ala lie Phe Gly Gin Pro Lys Glu 
275 280 285 

Lys Val Tyr Ala Glu Glu He Ala Gin Ala Trp Glu Thr Gly Glu Glv 
2 90 295 300 

Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 



310 



315 



320 



Glu Leu Gly Arg Glu Phe Phe Pro Met Glu Ala Gin Leu Ser Arg Leu 
325 330 335 

Val Gly Gin Ser Phe Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 
340 345 350 

Val Glu Trp Tyr Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 
355 360 365 

Pro Asn Lys Pro Ser Gly Arg Glu Leu Glu Arg Arg Arg Gly Gly Tyr 
370 375 380 

Ala Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn He 
385 390 395 400 

Ala Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser He He He Ser His 
405 405 410 

Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Gly Glu Tyr Asp 
415 420 425 

Glu Ala Pro Gin Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe 
430 435 440 



He Pro Ser Leu Leu Gly Asp Leu Leu Asp Glu Arg Gin Lys Val Lvs 
445 450 455 

Lys His Met Lys Ala Thr Val Asp Pro He Glu Lys Lys Leu Leu Asp 
460 465 470 — - 



475 



Tyr Arg Gin Arg Ala He Lys He Leu Ala Asn Ser Phe Tyr Gly Tyr 
480 485 490 



WO 98/49274 PCT/FR97/00761 

45 



Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser 
495 500 505 

Val Thr Ala Trp Gly Arg Gin Tyr lie Glu Thr Thr Met Arg Glu He 
51° 515 520 

Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Phe 
525 530 535 



Phe Ala Thr He Pro Gly Ala. Asp Ala Glu Thr Val Lys Lys Lvs Al 
540 545 555 



a 

560 



Arg Glu Phe Leu Asn Tyr He Asn Pro Lys Leu Pro Gly Leu Leu Glu 
565 570 575 

Leu Glu Tyr Glu Gly Phe Tyr Arg Arg Gly Phe Phe Val Thr Lys Lys 
580 585 590 

Lys Tyr Ala Val He Asp Glu Glu Gly Lys He Thr Thr Arg Gly Leu 
595 600 605 

Glu He Val Arg Arg Asp Trp Ser Glu Val Ala Lys Glu Thr Gin Ala 
610 615 620 

Arg Val Leu Glu Ala He Leu Arg His Gly Asp Val Glu Glu Ala Val 
625 630 635 640 

Arg lie Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 
645 650 J 655 

Pro Glu Lys Leu Val He His Glu Gin He Thr Arg Glu Leu Lys Asp 
660 665 ~ 670 

Tyr Lys Ala Thr Gly Pro His Val Ala lie Ala Lys Arg Leu Ala Ala 
675 680 685 

Arg Gly He Lys Val Arg Pro Gly Thr Val He Ser Tyr lie Val Leu 
690 695 700 

Lys Gly Ser Gly Arg He Gly Asp Arg Thr He Pro Phe Asp Glu Phe 
™5 710 715 720 

Asp Pro Thr Lys His Arg Tyr Asp Ala Glu Tyr Tyr He Glu Asn Gin 
725 730 735 

Val Leu Pro Ala Val Glu Arg He Leu Lys Ala Phe Gly Tyr Lys Lys 
740 745 750 

Glu Asp Leu Arg Tyr Gin Lys Thr Arg Gin Val Gly Leu Gly Ala Tro 
755 760 765 



Leu Lys Met Gly Lys Lys 
770 774 
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(2) INFORMATION POUR LA SEQ ID NO:3 : 

(i) CARACTRERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 360 acides amines 

(ii) TYPE DE MOLECULE: proline 
{ ix ) CARACTERISTIQUES 

(A) NOM/CLE: inteine I-Tfu-1 
(xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO: 3 : 

Cys His Pro Ala Asp Thr Lys Val He Val Lys Gly Lys Gly Val Val 
15 10 15 

Asn lie Ser Glu Val Arg Glu Gly Asp Tyr Val Leu Gly lie Asp Gly 
20 25 30 

Trp Gin Lys Val Gin Arg Val Trp Glu Tyr Asp Tyr Glu Gly Glu Leu 
35 40 45 

Val Asn He Asn Gly Leu Lys Cys Thr Pro Asn His Lys Leu Pro Val 
50 55 60 

Val Arg Arg Thr Glu Arg Gin Thr Ala lie Arg Asp Ser Leu Ala Lys 
65 70 75 so 

Ser Phe Leu Thr Lys Lys Val Lys Gly Lys Leu lie Thr Thr Pro Leu 
85 90 95 

Phe Glu Lys He Gly Lys He Glu Arg Glu Asp Val Pro Glu Glu Glu 
100 105 no 

He Leu Lys Gly Glu Leu Ala Gly He He Leu Ala Glu Gly Thr Leu 
115 120 125 

Leu Arg Lys Asp Val Glu Tyr Phe Asp Ser Ser Arg Gly Lys Lys Arg 
13 0 13 5 140 

Val Ser His Gin Tyr Arg Val Glu He Thr Val Gly Ala Gin Glu Glu 
145 155 160 

Asp Phe X Arg Arg He Val Tyr lie Phe Glu Arg Leu Phe Gly Val 
165 170 175 

Thr Pro Ser Val Tyr Arg Lys Lys Asn Thr Asn Ala He Thr Phe Lys 
180 .185 190 

Val Ala Lys Lys Glu Val Tyr Leu Arg Val Arg Glu lie Met Asp Glv 
i95 200 205 

He Glu Asn Leu His Ala Pro Ser Val Leu Arg Gly Phe Phe Glu Glv 
210 215 220 

Asp Gly Ser Val Asn Lys Val Arg Lys Thr Val Val Val Asn Gin Gly 
225 230 235 240 

Thr Asn Asn Glu Trp Lys lie Glu Val Val Ser Lys Leu Leu Asn Lys 
245 250 255 

Leu Gly He Pro His Arg Arg Tyr Thr Tyr Asp Tyr Thr Glu Arg Glu 
260 265 270 
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Lys Thr Met Thr Thr His lie Leu Glu lie Ala Gly Arg Asp Gly Leu 
275 280 285 

He Leu Phe Gin Thr He Val Gly Phe lie Ser Thr Glu Lys Asn Met 
290 295 300 

Ala Leu Glu Glu Ala He Arg Asn Arg Glu Val Asn Arg Leu Glu Asn 
3 °5 310 315 3 20 

Asn Ala Phe Tyr Thr Leu Ala Asp Phe Thr Ala Lys Thr Glu Tyr Tyr 
325 330 335 

Lys Gly Lys Val Tyr Asp Leu Thr Leu Glu Gly Thr Pro Tyr Tyr Phe 
340 345 350 

Ala Asn Gly He Leu Thr His Asn 
355 360 

(2) INFORMATION POUR LA SEQ ID NO: 4 : 

(i) CARACTRERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 389 acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: inteine I-Tfu-2 
(xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO: 4 : 

Ser Val Thr Gly Asp Thr Glu Val Thr He Arg Arg Asn Gly Arg He 
15 10 15 

Glu Phe Val Pro He Glu Lys Leu Phe Glu Arg Val Asp His Arg Val 
20 25 30 

Gly Glu Lys Glu Tyr Cys Val Leu Gly Gly Val Glu Ala Leu Thr Leu 
35 40 45 

Asp Asn Arg Gly Arg Leu Val Trp Lys Lys Val Pro Tyr Val Met Ara 
50 55 60 

His Lys Thr Asp Lys Arg He Tyr Arg Val Trp Phe Thr Asn Ser Trp 
65 70 75 80 

Tyr Leu Asp Val Thr Glu Asp His Ser Leu He Gly Tyr Leu Asn Thr 
85 90 95 

Ser Lys Val Lys Pro Gly Lys Pro Leu Lys Glu Arg Leu Val Glu Val 
100 105 " no 

Lys Pro Glu Glu Leu Gly Gly Lys Val Lys Ser Leu He Thr Pro Asn 
H5 120 125 

Arg Pro He Ala Arg Thr He Lys Ala Asn Pro lie Ala Val Lys Leu 
130 135 140 

Trp Glu Leu He Gly Leu Leu Val Gly Asp Gly Asn Trp Gly Gly Gin 
145 150 155 160 

Ser Asn Trp Ala Lys Tyr Tyr Val Gly Leu Ser Cys Gly Leu Asp Lys 



165 



170 



175 
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Ala Glu He Glu Arg Lys Val Leu Asn Pro Leu Arg Glu Ala Ser Val 

180 185 190 

lie Ser Asn Tyr Tyr Asp Lys Ser Lys Lys Gly Asp Val Ser lie Leu 

195 200 205 

Ser Lys Trp Leu Ala Gly Phe Met Val Lys Tyr Phe Lys Asp Glu Asn 

210 215 220 

Gly Asn Lys Ala He Pro Ser Phe Met Phe Asn Leu Pro Arg Glu Tyr 



230 



235 



240 



He Glu Ala Phe Leu Arg Gly Leu Phe Ser Ala Asp Gly Thr Val Ser 

245 250 255 

Leu Arg Arg Gly He Pro Glu He Arg Leu Thr Ser Val Asn Arg Glu 
260 265 270 

Leu Ser Asp Ala Val Arg Lys Leu Leu Trp Leu Val Gly Val Ser Asn 
275 280 285 

Ser Leu Phe Thr Glu Thr Lys Pro Asn Arg Tyr Leu Glu Lys Glu Ser 

290 295 300 

Gly Thr His Ser He His Val Arg He Lys Asn Lys His Arg Phe Ala 
305 310 315 320 

Asp Arg He Gly Phe Leu He Asp Arg Lys Ser Thr Lys Leu Ser Glu 

325 330 " 335 

Asn Leu Gly Gly His Thr Asn Lys Lys Arg Ala Tyr Lys Tyr Asp Phe 



345 



350 



Asp Leu Val Tyr Pro Arg Lys lie Glu Glu He Thr Tyr Asp Gly Tyr 



360 



365 



Val Tyr Asp He Glu Val Glu Gly Thr His Arg Phe Phe Ala Asn Gly 
370 375 380 



He Leu Val His Asn 
385 389 
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REVINDICATIONS 



1) ADN polymerase purifite thermostable 
d'archabacteries de 1 ' espece Thermococcus fumicolans 
ayant un poids moleculaire de 1'ordre de 89 000 daltons 
et ses derives enzymatiquement equivalents. 

2) ADN polymerase selon la revendication 1 dont 
la sequence en acides amines est representee dans la 
liste de sequence en annexe sous le numero SEQ ID NO:l ou 
un fragment de celle-ci ou encore un assemblage de tels 
fragments . 



3) ADN polymerase selon la revendication 2 dont 
la sequence en acides amines est representee dans la 
liste de sequence en annexe sous le numero SEQ id NO: 2. 

4) Une sequence d'ADN constitute par ou 
comprenant la sequence codant pour une ADN polymerase 
selon quelconque des revendications 1 a 3. 

5) Une sequence d'ADN selon la revendication 4 
constitute par ou comprenant la sequence comprise entre 
les nucleotides 357 a 5028 de la sequence SED ID NO: 1, 
ou un fragment de celle-ci ou encore un assemblage de 
tels fragments. 



6) Une sequence d'ADN selon 1 1 une des 
revendications 4 a 5 constitute par ou comprenant les 
nucleotides 357 a 1674 et 2755 a 3156 et 4324 a 5028 de 
la sequence d'ADN representee dans la liste de sequences 
en annexe sous le numero SED ID NO: 1. 



35 



7) Un vecteur contenant la sequence d'ADN de 
l'une quelconque des revendications 4 a 6. 
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8) Un hote transforme par un vecteur selon la 
revendication 7 . 

9) Procede de preparation d'une ADN polymerase 
thermostable d'archaebacteries de l'espece Thermococcus 
fumicolans, caracterise en ce que I'on cultive I'hSte 
selon la revendication 8 dans des conditions permettant 
1' expression de ladite ADN polymerase et en ce que l'on 
extrait et recupere celle-ci par tout moyen approprie. 

10) Procede d' amplification enzymatique d'une 
sequence d'acide nucleique caracterise en ce que l*on met 
en oeuvre une ADN polymerase thermostable selon l'une 
quelconque des revendications 1 a 3 . 

11) Inteine purifiee thermostable 
d'archaebacteries de l^spece Thermococcus fumicolans. 
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Fig. 3 

EB S Pab 46 50 51 52 PM 59 60 



212 




Pab 53 54 55 56 57 58 M 



212 




EB = extrait brut de sonication 

S = surnageant chauffe 

Pab = SOU de Pab 

PM = poids moleculaire en kDa 
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Fig .4 



28 29 30 31 32 33 P M kDa 




28, 29, 30, 31, 32, 33: fractions aprfcs la deuxieme Bleue 

P: phosphorylase B (92 kDa) 

M: marqueur de poids mol6culaire 
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Fig. 5 



46 47 48 49 M kDa 




P: phosphorylase B (92 kDa) 

46, 47, 48, 49: fractions apres phosphocellulose 

M: marqueur de poids moleculaire 
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Fig. 6 



p 234567 M KDa 



92KDa 




P: phosphorylase B (92 kDa) 

2, 3, 4, 5, 6, 7: fractions d'exclusions sur MonoQ 

M: marqueur de poids moleculaire 
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Fig. 7 



fractions d'exclusion de la MonoQ 

s vent Taqpol Raoul kb 



2,8 
2,3 

1,8 
1,41 
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